Piattaforma GenPat, Wiki

Topics
Topics

2AS_mapping

Introduzione

L'analisi 2AS_mapping esegue l'assembly con reference (o mapping) delle sequenze.

uml diagram

Lancia analisi 2AS_mapping

Una volta selezionata l'analisi 2AS_mapping nella pagina dedicata al lancio di analisi, sarà possibile selezionare il tool bioinformatico ("metodo") da usare tra quelli disponibili per l'analisi. I tool utilizzabili per questa analisi sono:

Nota: Nel caso si utilizzi il metodo snippy, è indispensabile che il campione scelto abbia l'analisi 4AN_genes associata (Prokka).

Nota: medaka è un tool open source sviluppato dalla Oxford Nanopore Technologies Ltd., da usare esclusivamente su dati di sequenziamento provenienti da apparati Nanopore.

Nella sezione dedicata alla definizione dei parametri, sarà necessario selezionare un reference per il mapping, dalla tabella pop-up accessibile cliccando sul tasto Seleziona reference. Il pop-up elenca sequenze di due tipologie, entrambe utilizzabili come reference:

  1. reference fasta files: file importati da database esterni - come ad es. NCBI - (elencati nella tabella delle reference di GenPat: https://genpat.izs.it/cmdbuild/ui/#classes/T_REFERENCE/cards);
  2. la consensus o il de novo assembly di un campione presente in GenPat (database interni).

Con il metodo "ivar", è possibile selezionare più di un reference (si faccia riferimento alla sezione "Reference multipli", più in basso).

L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input sono gli stessi utilizzabili anche per 2AS_denovo:

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Reference multipli

Se 2AS_mapping viene lanciato con Ivar, è possibile selezionare più di un reference, come mostrato nell'immagine riportata di seguito. La guida all'uso del sistema di selezione di reference multipli è consultabile nell'apposita sezione della Wiki sul lancio di analisi.

Cartella dei risultati

Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito;
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

Le tabelle sottostanti elencano i files prodotti dai tool disponibili per 2AS_mapping.

Bowtie2

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_bowtie_REFID.fasta file della consensus cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_bowtie_REFID.sorted.bam file di allineamento in formato .bam (Binary Alignment Map) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_bowtie_REFID.sorted.bam.bai file .bai (indice del file BAM) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_bowtie_REFID.var.flt.vcf file delle varianti identificate in formato .vcf cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_bowtie_REFID_coverage_plot.png grafico della distribuzione del coverage cartella "result"

iVar e Snippy

Si noti che l'uso di ivar comprende l'esecuzione dei tool snippy, samtools e, infine, ivar, mentre 2AS_mapping__snippy esegue esclusivamente il software da cui prende il nome.

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_ivar_REFID.fasta consensus ottenuta con ivar (Nota: 2AS_mapping__snippy non produce questo file) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.aligned.fa versione del reference con - nelle posizioni con sequencing depth = 0 (numero di read che allineano in quella posizione = 0) e N per depth compresa tra 0 ed il numero minimo di reads considerate nel coverage dei siti (non sono elencate varianti nel file) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.bam file di allineamento in formato .bam (Binary Alignment Map) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.bam.bai file .bai (indice del file BAM) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.bed file .bed (Browser Extensible Data) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.consensus.fa genoma reference con rappresentazione di tutte le varianti cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.consensus.subs.fa genoma reference con rappresentazione delle sole varianti di sostituzione cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.txt riassunto della run di snippy cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.tab tabella delle varianti in formato .tsv cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.csv tabella delle varianti in formato .csv cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.filt.vcf varianti filtrate da Freebayes cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.raw.vcf varianti non filtrate da Freebayes cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.subs.vcf tabella delle sole varianti di sostituzione in formato .vcf cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.gff varianti in formato GFF3 cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.html versione .html della tabella .tab delle varianti cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.vcf output file di snippy (varianti identificate), in formato .vcf (header di riepilogo + tabella) cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.vcf.gz output file .vcf compresso di snippy cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID.vcf.gz.csi indice bcftools del file .vcf.gz cartella "result"
DSXXXXXXXX-DTXXXXXX_ID_vdsnippy_REFID_coverage_plot.png grafico della distribuzione del coverage cartella "result"

Per ulteriori informazioni sui files prodotti da snippy, i loro formati ed il loro contenuto, si invita a fare riferimento al manuale di snippy.

medaka

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_medaka_REFID.fasta file fasta dell'allineamento cartella "result"

Visualizzazione dei dati

Per valutare la qualità delle sequenze ottenute, l'allineamento delle reads sul reference può essere visualizzato usando software specifici (ad esempio Tablet, BioEdit e uGene) per leggere i file .bam e .bam.bai: