Piattaforma GenPat, Wiki

Topics
Topics

2AS_hybrid

Introduzione

2AS_hybrid effettua l'assemblaggio ibrido di short e long reads. L'assembly ibrido permette di coprire le regioni ripetute del DNA e di collocarle nelle posizioni corrette, grazie alle tecnologie di sequenziamento di terza generazione che producono long reads; contemporaneamente, l'assembly ibrido aumenta l'accuratezza, grazie all'utilizzo delle tecnologie di sequenziamento di seconda generazione, che producono short reads.

uml diagram

Lancia analisi 2AS_hybrid

Una volta selezionata l'analisi 2AS_hybrid nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. L'unico metodo disponibile per l'assembly ibrido è:

  • Unicycler - pipeline di assemblaggio ibrido per genomi batterici.

Pagina GitHub di Unicycler: https://github.com/rrwick/Unicycler

2AS_hybrid richiede 2 input (si faccia riferimento all'immagine in basso):

  1. Long reads da sequenziatori con tecnologia nanopore (il campo "Long reads" è obbligatorio);
  2. Short reads da sequenziatori Illumina (il campo "Seleziona input" è obbligatorio). I possibili input per le short reads possono provenire dalle analisi di pre-processing delle reads Illumina, come:

Nota: l'esecuzione dell'assembly ibrido fallirà se, come secondo input, vengono utilizzate long reads al posto delle short reads Illumina.

L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 3 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito; qc: (quality check) in cui si trovano i file del controllo qualità. In questa cartella sono presenti le cartelle meta e result. Per questa analisi, il controllo qualità viene eseguito con quast;
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

La tabella sottostante presenta una lista dei file presenti nelle cartelle, insieme ad alcune informazioni utili.

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_unicycler.gfa file dell'assembly in formato .gfa cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_unicycler_assembly.fasta file dell'assembly ibrido in formato fasta cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_quast.csv file delle statistiche di qualità dell'assembly cartella qc > result