Piattaforma GenPat, Wiki

Topics
Topics

Pipeline Processamento Raw Reads

Introduzione

La pipeline Processamento Raw Reads esegue il preprocessamento delle reads (1PP), seguito dalla classificazione tassonomica.

Le reads prodotte dal sequenziatore vengono prima sottoposte ad un controllo della qualità con fastQC ed a trimming con trimmomatic (1PP_trimming); la successiva analisi tassonomica e l'assegnazione della specie calcolata vengono invece effettuate con Kraken (3TX_class).

Si ricorda che nell'analisi 1PP_trimming il controllo qualità viene eseguito con fastQC sia sulle raw reads che sulle reads trimmate ottenute.

uml diagram

La pipeline esegue le 2 analisi seguenti:

  1. Trimming delle raw reads per eliminare le basi con bassa qualità con trimmomatic (1PP_trimming__trimmomatic) e fastQC;
  2. Classificazione tassonomica dei batteri o virus individuati e controllo contaminazione con Kraken (3TX_class__kraken) e Quast. La classificazione con Kraken è resposabile dell'assegnazione della specie calcolata, sulla base della quale vengono automaticamente selezionate le pipelines a valle, se la Pipeline Processamento Raw Reads viene eseguita da NGSmanager.

Lancia Pipeline Processamento Raw Reads

Nel sistema di lancio analisi, è possibile usare il filtro in alto per visualizzare esclusivamente le pipelines. Una volta selezionata la pipeline Processamento Raw Reads nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma.

Gli input utilizzabili sono le raw reads in formato fastq (interne o importate).

L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

Una volta lanciata la pipeline, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo la pipeline, sia al termine dell'esecuzione.

Risultati

I files prodotti dalla pipeline "Processamento Raw Reads" saranno gli stessi prodotti dalle analisi che la compongono, organizzati con la stessa gerarchia. Come riferimento si rimanda quindi alle relative sezioni delle singole analisi: