4TY_wgMLST
Introduzione
4TY_wgMLST esegue il "whole genome Multi-Locus Sequence Typing" (wgMLST) in silico per le specie batteriche Campylobacter jejuni e Campylobacter coli. A differenza del protocollo cgMLST (core genome MLST), la caratterizzazione avviene sul whole genome.
Lancia Analisi 4TY_wgMLST
Una volta selezionata l'analisi 4TY_wgMLST nella pagina dedicata al lancio di analisi, sarà possibile selezionare il software bioinformatico (anche detto "metodo") da usare tra quelli disponibili per l'analisi. L'unico metodo utilizzabile per questo accertamento è chewBBACA - BSR-Based Allele Calling Algorithm.
Nota: Sono disponibili schemi per wgMLST solo per Campylobacter jejuni e Campylobacter coli. Il lancio dell'analisi su un altro microrganismo, per cui non sia presente lo schema wgMLST, comporterà il fallimento della run.
L'interfaccia per la selezione dell'input mette inoltre a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.
I possibili input utilizzabili per 4TY_wgMLST sono:
- step_2MG_denovo
- step_2AS_denovo
- step_2AS_mapping
- step_2AS_import
Sarà necessario specificare le sequenze di input provenienti da de novo assembly o da mapping e il genoma reference usato per il mapping, nel caso venga selezionato quest'ultimo come input.

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Cartella di output
Per consultare la guida sul download dei files dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella di output può essere esplorata cliccando sul link prodotto dalla pagina di download o sul link presente all'interno della scheda dell'analisi. La cartella verrà visualizzata con la seguente gerarchia: results > ANNO > ID > 4TY_wgMLST > DSXXXXXXXX-DTXXXXXX_chewbbaca. Nella cartella sarà possibile trovare le 3 directories seguenti:
- meta: ("metadata") in cui vengono salvati i files di log e di configurazione del processo eseguito.
- qc: ("quality check") in cui si trovano i files del controllo qualità. A sua volta in questa cartella sono presenti le cartelle meta e result. Per questo accertamento il controllo qualità viene effettuato da Quast.
- result: in cui sono salvati i files con i risultati prodotti dall'analisi.
Per la chiamata allelica con chewBBACA i risultati verranno forniti con codifica disponibile secondo 3 diversi schemi:
- schema IZS: ogni allele è identificato da un ID numerico progressivo. L'assegnazione dell'ID avviene considerando tutti i loci, quindi la numerazione NON ricomincia da 1 ad ogni nuovo locus.
- schema MD5: ogni allele è identificato da un codice alfanumerico di 16 caratteri (MD5), ottenuto applicando una funzione di "hash" alla sequenza stessa dell'allele; il che lo rende interscambiabile con altri metodi.
- schema CRC32: controllo basato sul Cyclic Redundancy Check (CRC). Ad ogni allele è assegnato un codice numerico di controllo (check value) determinato dal resto della divisione polinomiale del blocco di dati. Tale valore è utilizzato nello schema come identificatore dell'allele.
Si noti che il file di esempio "DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_ccoli_curated_210722.csv" riportato in tabella potrà riportare come suffisso l'abbreviazione per C. coli o C. jejuni, a differenza della specie analizzata.
| File | Descrizione | Posizione |
|---|---|---|
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_new_alleles.txt | sequenza dei nuovi alleli identificati | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_alleles.tsv | chiamata degli alleli secondo schema Pasteur pulito ogni volta in formato csv | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_ccoli_curated_210722.csv | tabella csv degli alleli. Righe: campioni, colonne: loci | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_contigsInfo.tsv | informazioni sul contig mappato su ogni locus | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_crc32.csv | tabella csv degli alleli codificati con schema CRC32. Righe: campioni, colonne: loci | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_izsam.csv | chiamata degli alleli secondo schema IZS | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_md5.csv | chiamata degli alleli secondo schema md5 | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_chewbbaca_results_statistics.tsv | statistiche sul numero di loci con codifica EXC, INF, LNF, PLOT, NIPH, ALM, ASM | cartella result |
| DSXXXXXXXX-DTXXXXXX_ID_import_chewbbaca_check.csv | controllo qualità con le informazioni su calledPerc, calledNum, annotated, new, notFound, discarded | cartella qc/result |
Per maggiori informazioni sulla codifica dei loci e sui files prodotti da chewBBACA, si invita a consultare la guida ufficiale di chewBBACA.