Piattaforma GenPat, Wiki

Topics
Topics

1PP_generated

Introduzione

L'analisi 1PP_generated costruisce un file FASTQ a partire da un file FASTA. Per ottenere tale risultato viene utilizzato uno script realizzato appositamente per GenPat, (fasta2fastq.py), che genera le righe con statistiche di qualità fittizie e modifica gli headers perchè siano conformi al formato fastq. Il software costruisce i file per entrambi i filamenti antiparalleli di DNA (R1 e R2).

Attenzione: Poichè le statistiche di qualità generate sono fittizie, lo scopo di questa analisi è unicamente quello di permettere l'uso di sequenze disponibili solo come file FASTA, per analisi i cui programmi accettano, normalmente, solo il formato fastq come input. I file di output, pertanto, non devono essere utilizzati, in sostituzione delle sequenze FASTQ effettive, nei workflow per i quali la valutazione della qualità delle reads ha importanza.

uml diagram

Lancia analisi 1PP_generated

Una volta selezionata l'analisi 1PP_generated nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. Il solo tool utilizzabile per questa analisi è fasta2fastq.

L'interfaccia per la selezione dell'input mette inoltre a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input utilizzabili per 1PP_generated sono:

Sarà necessario specificare le sequenze di input - in genere provenienti da de novo assembly o da mapping - e il genoma reference usato per il mapping, nel caso venga selezionato quest'ultimo come input.

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito.
  • result: in cui sono salvati i file con i risultati prodotti dall'analisi.

La tabella sottostante elenca i file prodotti da fasta2fastq.py.

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_fasta2fastq_R1.fastq.gz fastq fittizio del filamento + (file compresso: .gz) cartella "results"
DSXXXXXXXX-DTXXXXXX_ID_fasta2fastq_R2.fastq.gz fastq fittizio del filamento - (file compresso: .gz) cartella "results"