2AS_denovo
Introduzione
2AS_denovo esegue l'assembly de novo delle sequenze, producendo gli scaffolds del genoma.
Lancia analisi 2AS_denovo
Una volta selezionata l'analisi 2AS_denovo nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. I metodi utilizzabili per questo accertamento sono:
-
SPAdes - St. Petersburg genome assembler.
Pagina GitHub di SPAdes: https://github.com/ablab/spades
-
Unicycler - pipeline di assemblaggio ibrido per genomi batterici.
Pagina GitHub di Unicycler: https://github.com/rrwick/Unicycler
-
shovill - pipeline per l'assemblaggio di genomi di isolati batterici provenienti da read paired-end Illumina.
Pagina GitHub di shovill: https://github.com/tseemann/shovill
-
Flye - assemblatore de novo per read di sequenziamento a singola molecola.
Pagina GitHub di Flye: https://github.com/fenderglass/Flye
-
plasmidSPAdes - St. Petersburg genome assembler per l'assemblaggio di plasmidi batterici.
Pagina GitHub di plasmidSPAdes: https://github.com/ablab/spades
Nota: il tool Flye è dedicato esclusivamente all'assemblaggio di long reads generate da apparati Oxford Nanopore; il tool plasmidSPAdes è un'iterazione di SPAdes concepita per l'uso con plasmidi.
L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.
I possibili input possono provenire da:
- step_1PP_trimming
- step_1PP_hostdepl
- step_1PP_downsampling
- step_1PP_generated
- step_3TX_class
- step_4AN_AMR

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Cartella dei risultati
Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 3 sotto-cartelle:
- meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito; qc: (quality check) in cui si trovano i file del controllo qualità. In questa cartella sono presenti le cartelle meta e result. Per questa analisi, il controllo qualità viene eseguito con quast;
- result: in cui sono salvati i files con i risultati prodotti dall'analisi.
Le tabelle in basso presentano la lista di files presenti nelle cartelle, insieme ad alcune informazioni utili.
SPAdes
| File | Descrizione | Posizione |
|---|---|---|
| DSXXXXXXXX-DTXXXXXX_ID_spades_contigs.fasta | file dei contigs del de novo assembly | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_spades_scaffolds.fasta | file degli scaffolds | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_spades_scaffolds_L200.fasta | file contenente gli scaffolds con lunghezza >200bp | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_quast.csv | file delle statistiche di qualità dell'assembly | cartella qc > result |
Unicycler
| File | Descrizione | Posizione |
|---|---|---|
| 001_best_spades_graph.gfa | de novo assembly in formato .gfa - fase di pulizia 1 | cartella "result" |
| 002_overlaps_removed.gfa | de novo assembly in formato .gfa - fase di pulizia 2 | cartella "result" |
| 003_bridges_applied.gfa | de novo assembly in formato .gfa - fase di pulizia 3 | cartella "result" |
| 004_final_clean.gfa | de novo assembly in formato .gfa - fase di pulizia 4 | cartella "result" |
| 005_polished.gfa | de novo assembly in formato .gfa - fase di pulizia 5 | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_unicycler_assembly.fasta | file dei contigs del de novo assembly | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_unicycler_scaffolds_L200.fasta | file contenente gli scaffolds con lunghezza >200bp | cartella "result" |
| assembly.gfa | de novo assembly in formato .gfa | cartella "result" |
| DSXXXXXXXX-DTXXXXXX_ID_quast.csv | file delle statistiche di qualità dell'assembly | cartella qc > result |
shovill
| File | Descrizione | Posizione |
|---|---|---|
| DSXXXXXXXX-DTXXXXXX_ID_shovill.fasta | file dei contigs del de novo assembly | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_quast.csv | file delle statistiche di qualità dell'assembly | cartella qc > result |
Flye
| File | Descrizione | Posizione |
|---|---|---|
| DSXXXXXXXX-DTXXXXXX_ID_flye.fasta | file dei contigs del de novo assembly | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_quast.csv | file delle statistiche di qualità dell'assembly | cartella qc > result |