Piattaforma GenPat, Wiki

Topics
Topics

3TX_class

Introduzione

L'accertamento 3TX_class esegue la classificazione tassonomica degli organismi d'origine delle reads ed effettua un controllo delle contaminazioni. 3TX_class__kraken produce appunto i risultati relativi alla contaminazione, consultabili in Reports > Dettaglio > Check > Check Taxa.

uml diagram

Lancia Analisi 3TX_class

Una volta selezionata l'analisi 3TX_class nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico (anche detto "metodo") da usare tra quelli disponibili per l'analisi. I metodi utilizzabili per questo accertamento sono elencati nella lista sottostante.

Per tutti i microrganismi:

Solo per i generi Escherichia, Salmonella e Listeria:

Solo per single long reads da campioni di metagenomica sequenziati con tecnologia nanopore:

Nota: Kraken 2 differisce dalla prima versione. Trattandosi di softwares paralleli, sono entrambi disponibili nel sistema di lancio analisi. Per informazioni riguardo il fuzionamento e le differenze tra Kraken e Kraken 2 si invita a consultare il loro manuale ufficiale al link seguente: https://github.com/DerrickWood/kraken2/blob/master/docs/MANUAL.markdown.

L'interfaccia per la selezione dell'input mette inoltre a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input utilizzabili per 3TX_class sono:

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella di output

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella di output può essere esplorata cliccando sul link prodotto dalla pagina di download o sul link presente all'interno della scheda dell'analisi. La cartella verrà visualizzata con la seguente gerarchia: results > ANNO > ID > 3TX_class > DSXXXXXXXX-DTXXXXXX_kraken, dove "_kraken" può essere sostituito con il nome del tool utilizzato. Nella cartella sarà possibile trovare le 2 directories:

  • meta: ("metadata") in cui vengono salvati i files di log e di configurazione del processo eseguito.
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

Le tabelle sottostanti elencano i files prodotti dai tool disponibili per 3TX_class. Per maggiori dettagli sui file prodotti dalle due versioni di kraken, si invita a fare riferimento al manuale di kraken e al Kraken2's help sheet.

Kraken

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_kraken.tsv file di classificazione tassonomica di kraken cartella result

Kraken 2

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_bracken_genus.tsv abbondanza stimata delle reads a livello di genere di appartenenza rinvenuto cartella result
DSXXXXXXXX-DTXXXXXX_ID_bracken_genus_report.tsv report file di classificazione tassonomica a livello di genere cartella result
DSXXXXXXXX-DTXXXXXX_ID_bracken_species.tsv abbondanza stimata delle reads a livello di specie di appartenenza rinvenuta cartella result
DSXXXXXXXX-DTXXXXXX_ID_bracken_species_report.tsv report file di classificazione tassonomica a livello di specie cartella result
DSXXXXXXXX-DTXXXXXX_ID_kraken.tsv report file di classificazione tassonomica a livello di ceppo cartella result
DSXXXXXXXX-DTXXXXXX_ID_kraken.txt.gz file di testo compresso con le sequenze classificate da kraken2 cartella result

ConFindr

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_contamination.csv tabella csv delle contaminazioni identificate nel campione da ConFindr cartella result
DSXXXXXXXX-DTXXXXXX_ID_rmlst.csv tabella csv degli alleli per ogni gene nel campione cartella result
DSXXXXXXXX-DTXXXXXX_ID_confindr_report.csv tabella csv totale dei campioni e delle contaminazioni identificate da ConFindr cartella result

Centrifuge

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_centrifuge.output file di output tabulare di Centrifuge contenente il taxa ID e relativo score e secondo miglior score (aprire con editor di testo o fogli di calcolo) cartella result
DSXXXXXXXX-DTXXXXXX_ID_centrifuge.report report tabulare di Centrifuge con la lista degli organismi rinvenuti nel campione e le loro statistiche (aprire con editor di testo o fogli di calcolo) cartella result

Per ulteriori informazioni sugli output di Centrifuge e sulle caratteristiche del software, si invita a consultare la pagina GitHub ufficiale di Centrifuge.