Piattaforma GenPat, Wiki

Topics
Topics

3TX_species

Introduzione

3TX_species assegna la specie, batterica o virale, più vicina alle sequenze in esame. Se il tool utilizzato è vdabricate, l'analisi identifica il miglior reference virale da utilizzare per le analisi a valle. Kmerfinder è il tool usato per l'identificazione del "best reference" e determina la specie assegnata.

uml diagram

Lancia analisi 3TX_species

Una volta selezionata l'analisi 3TX_species nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. I metodi utilizzabili per questa analisi sono:

Per l'assegnazione di specie batteriche:

Per l'assegnazione di specie virali:

  • vdabricate - Screening massivo dei contig per specie virali di un database predefinito utilizzando Abricate.

Il tool vdabricate può essere utilizzato per l'identificazione del genoma reference migliore per un virus di interesse, in base alle corrispondenze di sequenza trovate nel database delle sequenze virali (DB_Virus).

Per tutte le specie:

Per 3TX_species è necessario specificare le sequenze di input - provenienti da un assembly de novo o da un mapping - e indicare il genoma reference utilizzato per il mapping, se quest'ultimo viene selezionato come input.

L'interfaccia per la selezione dell'input mette inoltre a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input utilizzabili per 3TX_species sono:

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito;
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

Le tabelle sottostanti elencano i files prodotti dai tool disponibili per 3TX_species.

KmerFinder

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_kmerfinder_bacterial.tsv file con la specie batterica assegnata cartella "results"
DSXXXXXXXX-DTXXXXXX_ID_kmerfinder_viral.tsv file con la specie virale assegnata cartella "results"

vdabricate

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_vdabricate_calls.txt corrispondenze individuate nel DB_Virus cartella "result"

BLAST

File Descrizione Posizione
results.csv tabella riassuntiva dei file dei risultati, con campi separati da ";" cartella "results"
DSXXXXXXXX-DTXXXXXX_ID_blast_nt.asn.gz dati delle sequenze in formato .asn (Abstract Syntax Notation) compresso cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_blast_nt.csv tabella .csv dei risultati dell'allineamento di sequenza cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_blast_nt.txt risultati dell'allineamento delle sequenze nell'output standard di BLASTn cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_blast_nt_max_target_seqs_5.csv tabella .csv dei risultati dell'allineamento, filtrata per le 5 sequenze più vicine cartella "result"

Mash

File Descrizione Posizione
DS9573634-DT230426121427891_2019.TE.13476.1.1_mash_screen.tsv tabella intermedia, con le percentuali di identità di sequenza, tra il genoma del campione e le sequenze testate cartella "result"
DS9573634-DT230426121427891_2019.TE.13476.1.1_mash_screening_results.tsv file .tsv con l'assegnazione finale della specie cartella "result"