Piattaforma GenPat, Wiki

Topics
Topics

2AS_denovo

Introduzione

2AS_denovo esegue l'assembly de novo delle sequenze, producendo gli scaffolds del genoma.

uml diagram

Lancia analisi 2AS_denovo

Una volta selezionata l'analisi 2AS_denovo nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. I metodi utilizzabili per questo accertamento sono:

Nota: il tool Flye è dedicato esclusivamente all'assemblaggio di long reads generate da apparati Oxford Nanopore; il tool plasmidSPAdes è un'iterazione di SPAdes concepita per l'uso con plasmidi.

L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input possono provenire da:

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 3 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito; qc: (quality check) in cui si trovano i file del controllo qualità. In questa cartella sono presenti le cartelle meta e result. Per questa analisi, il controllo qualità viene eseguito con quast;
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

Le tabelle in basso presentano la lista di files presenti nelle cartelle, insieme ad alcune informazioni utili.

SPAdes

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_spades_contigs.fasta file dei contigs del de novo assembly cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_spades_scaffolds.fasta file degli scaffolds cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_spades_scaffolds_L200.fasta file contenente gli scaffolds con lunghezza >200bp cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_quast.csv file delle statistiche di qualità dell'assembly cartella qc > result

Unicycler

File Descrizione Posizione
001_best_spades_graph.gfa de novo assembly in formato .gfa - fase di pulizia 1 cartella "result"
002_overlaps_removed.gfa de novo assembly in formato .gfa - fase di pulizia 2 cartella "result"
003_bridges_applied.gfa de novo assembly in formato .gfa - fase di pulizia 3 cartella "result"
004_final_clean.gfa de novo assembly in formato .gfa - fase di pulizia 4 cartella "result"
005_polished.gfa de novo assembly in formato .gfa - fase di pulizia 5 cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_unicycler_assembly.fasta file dei contigs del de novo assembly cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_unicycler_scaffolds_L200.fasta file contenente gli scaffolds con lunghezza >200bp cartella "result"
assembly.gfa de novo assembly in formato .gfa cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_quast.csv file delle statistiche di qualità dell'assembly cartella qc > result

shovill

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_shovill.fasta file dei contigs del de novo assembly cartella result
DSXXXXXXXX-DTXXXXXX_ID_quast.csv file delle statistiche di qualità dell'assembly cartella qc > result

Flye

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_flye.fasta file dei contigs del de novo assembly cartella result
DSXXXXXXXX-DTXXXXXX_ID_quast.csv file delle statistiche di qualità dell'assembly cartella qc > result