CFSAN
Introduzione
CFSAN effettua un'analisi filogenetica reference-based e conseguente costruzione di un dendrogramma di distanza tra microrganismi, usando l'algoritmo "Maximum Likelihood" (ML), a partire da una matrice di Polimorfismi a Singolo Nucleotide (SNPs).
Maggiori informazioni sul software sono disponibili nella guida ufficiale di CFSAN.
Pagina GitHub di CFSAN: https://github.com/CFSAN-Biostatistics/snp-pipeline
Lancia Analisi CFSAN
Una volta selezionata l'analisi CFSAN nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma dell'analisi scelta.
Nella schermata di definizione parametri sarà necessario specificare un genoma reference; inoltre l'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi. Nel caso di CFSAN, gli input sono sempre raw reads in formato FASTQ, ma possono essere interne (step_0SQ_rawreads__fastq) o importate in piattaforma (step_0SQ_rawreads__external).

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di verificare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Dalla scheda dell'analisi completata è possibile, oltre all'esplorazione della cartella di output, anche la visualizzazione dell'albero nwk e l'accesso diretto ad alcuni dei files di log e metadati.
Cartella dei risultati
Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:
- meta: ("metadati") in cui vengono salvati i file di log e di configurazione del processo eseguito.
- result: in cui sono salvati i file con i risultati prodotti dall'analisi.
La tabella in basso presenta la lista dei principali file di interesse presenti nelle cartelle, insieme ad alcune informazioni utili.
| File | Descrizione | Posizione |
|---|---|---|
| metrics.tsv | tabella .tsv riassuntiva, con valori e statistiche dei campioni e relativi SNPs | cartella "result" |
| referenceSNP.fasta | file FASTA contenente le basi della sequenza reference per tutte le posizioni degli SNPs | cartella "result" |
| snp_distance_matrix.tsv | tabella .tsv con matrice di distanza, calcolata sulle differenze in SNP, per ogni coppia di campioni | cartella "result" |
| snp_distance_pairwise.tsv | tabella .tsv con le pairwise distances in base alle differenze in SNPs per ogni coppia di campioni | cartella "result" |
| snpma.fasta.nwk | file dell'albero in formato .nwk (newick) calcolato con algoritmo ML | cartella "result" |
| snpma.vcf | elenco degli SNPs e delle relative posizioni, per ogni campione, in formato VCFv4.2 | cartella "result" |
Per ulteriori informazioni in merito a tutti gli output di CFSAN, si invita a consultare l'apposita sezione del manuale ufficiale CFSAN.