Snippy-core
Introduzione
Snippy-core effettua l'estrazione dei core SNPs dai file VCF prodotti da Snippy (Rapid haploid variant calling and core genome alignment).
Se non è stato precedentemente eseguito un allineamento con Snippy, l'analisi Snippy-core effettuerà, in un primo momento, il lancio del tool Snippy, per produrre - tramite allineamento ad un reference GeneBank con formato .gb o .gbk - i file VCF dei campioni selezionati; successivamente, essa calcolerà il VCF-core per i campioni del dataset, usando Snippy-core (da cui la pipeline prende il nome). Il core.vcf così generato contiene le varianti (SNPs e indels) core tra quelle originariamente presenti nei VCF dei singoli campioni.
Nel caso siano stati già eseguiti gli allineamenti con Snippy, l'analisi esegue solo il software Snippy-core.
Pagina GitHub di Snippy & Snippy-core: https://github.com/tseemann/snippy
Lancia Analisi Snippy-core
Una volta selezionata l'analisi Snippy-core nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma dell'analisi scelta. Il lancio è specifico per la pipeline di Snippy + Snippy-core e non vi sono altri tool utilizzabili.
Nell'interfaccia per la definizione dei parametri, sarà necessario selezionare un reference. Verrà sempre usato un reference .gb per permettere l'esecuzione di Snippy-core, dopo Snippy.
La sezione dedicata alla selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.
I possibili input utilizzabili per Snippy-core sono:

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di verificare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Cartella dei risultati
Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:
- meta: ("metadati") in cui vengono salvati i file di log e di configurazione del processo eseguito.
- result: in cui sono salvati i file con i risultati prodotti dall'analisi.
La tabella in basso presenta la lista dei principali file di interesse presenti nelle cartelle, insieme ad alcune informazioni utili.
| File | Descrizione | Posizione |
|---|---|---|
| core.aln | file FASTA con le sequenze dei campioni e del reference | cartella "result" |
| core.full.aln | file FASTA con le sequenze dei campioni allineate al reference | cartella "result" |
| core.ref.fa | file FASTA con la sequenza nucleotidica del genoma reference | cartella "result" |
| core.tab | tabella .tsv delle varianti. Colonne: cromosoma, posizione, nucleotide nel reference, nucleotide nel campione 1, nucleotide nel campione 2... | cartella "result" |
| core.txt | file di testo con tabella riassuntiva delle caratteristiche delle sequenze di campioni e reference | cartella "result" |
| core.vcf | file VCFv4.2 delle varianti. Comprende un header informativo e la tabella con il tipo di variante e una matrice binaria di presenza/assenza della variante nei campioni | cartella "result" |