Piattaforma GenPat, Wiki

Topics
Topics

Gestione dei campioni ufficiali

Si comunica che, in accordo con i relativi Laboratori Nazionali di riferimento, a partire da Lunedì 3 Giugno 2024 è attiva una nuova modalità di fruizione dei genomi dei ceppi di L. monocytogenes,Campylobacter e, dal 2025, Brucella, caricati nella piattaforma del “Centro di Referenza Nazionale per Sequenze Genomiche di microrganismi patogeni: banca dati e analisi di bioinformatica (GENPAT) sono disponibili all’indirizzo https://genpat.izs.it.

Tale nuova modalità consentirà, agli utenti autorizzati, di visualizzare metadati minimi e risultati di caratterizzazione genomica di tutti i ceppi di L. monocytogenes, Campylobacter e Brucella isolati, nel territorio nazionale, nell’ambito del controllo ufficiale e delle altre attività ufficiali, come definite dal Regolamento (UE) 2017/625 e dal D. Lgs. 2 febbraio 2021, n.27.

Sarà inoltre possibile esportare i profili allelici e le sequenze assemblate (de novo assembly), per l’eventuale utilizzo nell’ambito delle attività e scopi del Servizio Sanitario Nazionale.

Regole per l'accesso ai dati

La piattaforma GENPAT consente agli utenti con profilo "IZS Listeria" di visualizzare metadati minimi e risultati di caratterizzazione genomica delle seguenti sequenze:

  • Sequenze di ceppi di L. monocytogenes prelevati dal 01/01/2021, nel territorio nazionale, nell’ambito del controllo ufficiale e delle altre attività ufficiali, come definite dal Regolamento (UE) 2017/625 e dal D. Lgs. 2 febbraio 2021, n.27;
  • Valori di qualità delle sequenze conformi alla SOP accreditata IZS TE B2.1.9 SOP032.
  • Valori di qualità delle chiamate alleliche conformi alla SOP accreditata IZS TE B912.1 SOP001.

La piattaforma consente inoltre agli utenti con profilo "IZS Campylobacter" di visualizzare metadati minimi e risultati di caratterizzazione genomica delle seguenti sequenze:

  • Sequenze di ceppi di Campylobacter prelevati dal 01/01/2021, nel territorio nazionale, nell’ambito del controllo ufficiale e delle altre attività ufficiali, come definite dal Regolamento (UE) 2017/625 e dal D. Lgs. 2 febbraio 2021, n.27.
  • Valori di qualità delle sequenze conformi alla SOP accreditata IZS TE B2.1.9 SOP032.
  • Valori di qualità delle chiamate alleliche conformi alla SOP accreditata IZS TE B3.1.3 SOP071.

La piattaforma consente inoltre agli utenti con profilo "IZS Brucella" di visualizzare metadati minimi e risultati di caratterizzazione genomica delle seguenti sequenze:

  • Sequenze di ceppi di Brucella prelevati dal 01/01/2023, nel territorio nazionale, nell’ambito del controllo ufficiale e delle altre attività ufficiali, come definite dal Regolamento (UE) 2017/625 e dal D. Lgs. 2 febbraio 2021, n.27.
  • Valori di qualità delle sequenze conformi alla SOP accreditata IZS TE B2.1.9 SOP032.
  • Valori di qualità delle chiamate alleliche conformi alla SOP accreditata IZS TE B3.1.3 SOP076.

Qualità dei dati

Per ogni campione immesso in piattaforma, la pipeline NgsManager riporta nella tabella dei Campioni i dati di qualità (Sezione Controllo qualità) e vengono verificati i valori di qualità in accordo con le SOP sopra menzionate. Di seguito vengono riepilogati i valori principali.

NGS (IZS TE B2.1.9 SOP032)

Parametro Valore accettabile
Numero di reads totali Campylobacter sp. ≥ 320.000
Numero di reads totali L. monocytogenes ≥ 580.000
Q-score ≥ 30

L. monocytogenes (IZS TE B912.1 SOP001)

Parametro Valore accettabile
Lunghezza del genoma L. monocytogenes ± 5%
Sequence Type e CC 100%
Numero di loci identificati cgMLST ≥ 95% (1660)

Campylobacter (IZS TE B3.1.3 SOP071)

Parametro Valore accettabile
Lunghezza del genoma C. jejuni ± 5%
Lunghezza del genoma C. coli ± 5%
Sequence Type e CC 100%
Numero di loci identificati cgMLST C. jejuni ≥ 95% (644)
Numero di loci identificati wgMLST C. jejuni ≥ 30% (838)
Numero di loci identificati cgMLST C. coli ≥ 95% (501)
Numero di loci identificati wgMLST C. coli ≥ 30% (743)

Brucella (IZS TE B3.1.3 SOP076)

Parametro Valore accettabile
Numero di loci identificati cgMLST B.Melitensis ≥ 95% (2455)
Numero di loci identificati wgMLST Altre specie Brucella ≥ 95% (1676)
Analisi SNP: coverage orizzontale ≥ 97%
Analisi SNP: coverage verticale ≥ 30

Inoltre, viene identificata la specie calcolata a partire dai dati genomici (campo Specie Calcolata della tabella Campioni). Tale valore deve essere concorde con il valore della specie dichiarata (campo Specie).

La pipeline automatica verifica i valori di qualità e la concordanza tra "specie" dichiarata e "specie calcolata"; successivamente, a seconda della correttezza dei valori, la pipeline imposta, nella colonna Controllo della tabella "Campioni", il risultato OK nel caso vengano soddisfatti tutti i valori, Fallito o Attenzione, con specifica indicazione dei valori non soddisfatti.

Profili IZS e LAB

Ad ogni utente associato ad una organizzazione (ORG) e abilitato alla gestione dei campioni ufficiali, vengono assegnati due profili della piattaforma GENPAT:

  • IZS: per la gestione dei campioni ufficiali;
  • LAB: per la gestione di campioni, sia ufficiali che non, appartenenti all'organizzazione.

Nella tabella seguente sono riepilogati


Profilo IZS Profilo LAB
Accesso ai campioni Non ha associata alcuna organizzazione per i filtri sui campioni. Ciò consente di accedere a tutti i campioni ufficiali d'Italia (come definito precedentemente nella sezione "Regole per l'accesso ai dati"), prelevati a partire dal 2021 e che abbiano il campo Controllo=OK. Ha associato ORG come organizzazione di appartenenza per i filtri sui campioni. Ciò consente di accedere a tutti i campioni inviati da ORG, indipendentemente dalla tipologia e dalla qualità dei dati.
Accesso ai metadati Ha accesso limitato ai metadati dei campioni ufficiali di tutta Italia. Ha inoltre accesso limitato al livello di dettaglio dei metadati stessi. Ad esempio, è possibile conoscere il comune di prelievo ma non il punto esatto. Ha accesso completo ai metadati (e al livello di dettaglio) dei campioni inviati da ORG.
Download Consente di scaricare i profili allelici e l'assembly de novo dei campioni ufficiali italiani. Consente di scaricare qualsiasi risultato di analisi disponibile su GENPAT sui campioni appartenenti a ORG.
Upload Ha associato ORG come organizzazione di appartenenza per gli upload. Ciò consente di inviare sequenze di campioni appartenenti a ORG. Ha associato ORG come organizzazione di appartenenza per gli upload.
Analisi Consente di lanciare analisi di confronto fra i campioni ufficiali italiani. Consente di lanciare qualsiasi analisi disponibile su GENPAT sui campioni appartenenti a ORG.

N.B.: Come profilo IZS, è possibile vedere, nella tabella Campioni con anomalie, i campioni inviati da ORG che hanno, nella colonna Controllo, un risultato diverso da OK. Tali campioni non possono essere utilizzati nel lancio di analisi. Si tiene a precisare che, nella tabella Campioni con Anomalie, non sono visibili i campioni anomali appartenenti ad altre organizzazioni.

Upload di campioni ufficiali

Dati di sequenza NGS (dati grezzi)

Relativamente ad isolati di L. monocytogenes e Campylobacter prelevati da campionamento ufficiale, la comunicazione di invio del ceppo, o dei dati NGS (dati grezzi) della sequenza, va effettuata tramite l'applicativo SEAP, analogamente a quanto fatto fino ad oggi.

Una procedura automatica assicura che i dati di sequenza e i matadati inviati al SEAP siano disponibili nella piattaforma GENPAT.

Il SEAP sarà integrato a breve all'interno della piattaforma GENPAT. Verrà data adeguata comunicazione non appena tale integrazione sarà completata.

Dati di assemblaggio

Inoltre, per i laboratori ufficiali che vogliano inviare i file di assemblati de novo direttamente nella piattaforma GENPAT, è disponibile una pagina di upload dedicata.

N.B.: Tale funzionalità è disponibile previa verifica di compatibilità della pipeline bioinformatica utilizzata. A tal proposito contattare il CRN GENPAT.

Analisi di bioinformatica

Analisi automatiche

Tutti i campioni inviati alla piattaforma GENPAT vengono processati automaticamente tramite la pipeline NgsManager. In particolare, per la produzione di assembly de novo e di profili allelici, tale pipeline è compatibile con la OneHealth analytical pipeline messa a disposizione da EFSA.

Analisi manuali

Le analisi disponibili sui campioni ufficiali sono:

  • Grapetree: costruisce grafici ad albero usando i 2 algoritmi "Minimum Spanning Tree" (MSTree) e "Neighbor Joining" (NJ) a partire dai profili allelici dei campioni forniti, così come identificati nell'analisi cgMLST.
  • ReporTree: analogamente a GrapeTree crea grafici di distanza tra microrganismi utilizzando i profili allelici dell'analisi cgMLST. L'albero viene generato con l'algoritmo "Minimum Spanning Tree" (MSTreeV2).
  • ReporTree (SNP): questa analisi è disponibile solo per Brucella e genera grafici di distanza tra microrganismi a partire da un allineamento di SNP prodotto con il tool Snippy, derivato da mapping eseguiti sullo stesso riferimento genomico (GCF_000740415.1). L'albero viene costruito utilizzando l’algoritmo Minimum Spanning Tree (MSTreeV2).
  • Surveillance Listeria monocytogenes: questa analisi è, al momento, disponibile solo per Listeria monocytogenes.

Download

Con il profilo IZS è possibile scaricare i profili allelici e l'assembly de novo. Per effettuare lo scarico dei files è obbligatorio compilare una nota indicando il motivo e l'utilizzo di tali dati.

Supporto

Per richieste di supporto utilizzare le funzioni di Help desk accessibili tramite la relativa voce presente nel menu contestuale del Wiki posto in alto a destra della piattaforma. Qui la pagina di dettaglio con video esplicativo.