ReporTree
Introduzione
ReporTree costruisce grafici di distanza tra microrganismi a partire dai profili allelici dei campioni forniti. L'albero viene costruito con l'algoritmo "Minimum Spanning Tree" (MSTree o MST).
Pagina github di ReporTree https://github.com/insapathogenomics/ReporTree
Una volta calcolato l'albero, è possibile visualizzarlo direttamente in piattaforma (usando SPREAD) tramite il sistema integrato di visualizzazione dendrogrammi, accessibile dalla scheda dell'analisi completata.
Lancia analisi ReporTree
Una volta selezionata l'analisi ReporTree nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma: non vi è necessità di scegliere il tool, in quanto l'analisi è specifica per l'uso di ReporTree.
L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.
I possibili input utilizzabili per ReporTree sono:
Per entrambi gli input possibili, è necessario che il software utilizzato per il calcolo dei profili allelici sia chewBBACA. Si ponga quindi attenzione nel selezionare tale software per il lancio dell'analisi 4TY_cgMLST o 4TY_wgMLST, se si intende lanciare ReporTree come analisi a valle.
Nella schermata di definizione parametri è possibile:
- selezionare la codifica: le possibilità comprendono la codifica izsam e la codifica crc32. La selezione di default corrisponde a crc32.
- specificare lo schema per la specie microbica su cui è stato eseguito 4TY_cgMLST__chewbbaca, se vengono selezionati come input i profili allelici da cgMLST. Il campo è precompilato con lo schema appropriato alla specie batterica i cui codici sono presenti nel carrello o tag attivo, usato per il lancio dell'analisi. Non è pertanto necessario alcun intervento ulteriore, da parte dell'utente.
Nota: di default ReporTree usa come input l'output della versione 2.8.5 del database di ChewBBACA, con encoding crc32. Allo scopo di mantenere retrocompatibilità con gli esami precedenti, rimane possibile eseguire ReporTree sui vecchi profili calcolati con ChewBBACA 2.8.4; in tal caso è necessario selezionare izsam come encoding.
Si noti che tali associazioni devono essere rispettate perchè l'analisi venga effettuata correttamente. Qualunque altra combinazione comporterà il fallimento dell'analisi.
Si noti inoltre che, ai fini della validità delle analisi effettuate, è necessario usare ChewBBACA 2.8.5.
La scheda per la definizione dei parametri offre un elevato livello di personalizzazione, con campi in cui è possibile specificare i valori desiderati. L'ultimo campo, Custom parameters, permette di aggiungere ulteriori argomenti, elencati come flags, in riga di comando, in UNIX-style o GNU-style. Per maggiori informazioni in merito a ReporTree e al suo utilizzo, si invita a consultare la guida ufficiale di ReporTree.
Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di verificare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Nella scheda dell'analisi completata saranno presenti alcune opzioni, oltre alla possibilità di esplorare la cartella di output, come l'accesso diretto ad alcuni dei files di log e metadati, l'apertura del file nwk e la visualizzazione diretta dell'albero MSTree tramite l'integrazione di GrapeTree in piattaforma.
Per visualizzare l'albero sarà necessario navigare nella scheda del risultato di GrapeTree e selezionare il link Minimum Spanning Tree with Grapetree:

Nota: I risultati delle analisi multi-campione non possono essere importati. Si invita a sfruttare l'apposita funzionalità per la conservazione delle analisi non importabili o, in alternativa, l'opzione per il download diretto del file newick (
.nwk) e del file dei metadati, in modo da poter conservare i file e visualizzare l'albero in qualunque momento, sia all'interno della piattaforma che con un software esterno.
Cartella dei risultati
Per consultare la guida sul download dei file dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results è possibile trovare 2 sotto-cartelle:
- meta: ("metadata") in cui vengono salvati i file di log e di configurazione del processo eseguito.
- result: in cui sono salvati i file con i risultati prodotti dall'analisi.
La tabella in basso presenta la lista dei principali file di interesse presenti nelle cartelle, insieme ad alcune informazioni utili.
| File | Descrizione | Posizione |
|---|---|---|
| gt_clusterComposition.tsv | Tabella con elenco dei cluster e loro composizione | cartella "result" |
| gt_dist_grapetree.tsv | Matrice di distanza | cartella "result" |
| reportree_metadata.tsv | Tabella dei metadati dei campioni | cartella "result" |
| gt_metadata_w_partitions.tsv | Tabella dei metadati dei campioni + cluster di appartenenza in base alle partizioni | cartella "result" |
| gt.nwk | Albero MST in formato newick | cartella "result" |
| gt_dist_hamming.tsv | Tabella con le distanze di Hamming | cartella "result" |
| result_alleles_all.tsv | Tabella delle chiamate alleliche | cartella "result" |
| gt_dist.tsv | Elenco delle distanze pairwise tra campioni | cartella "result" |
| gt_partitions_summary.tsv | Elenco delle partizioni dell'albero e relativi campioni nei cluster | cartella "result" |
| gt_loci_report.tsv | Report sulle statistiche dei loci usati | cartella "result" |
| gt_partitions.tsv | Tabella dei campioni e relativa appartenenza a cluster in base al partizionamento | cartella "result" |
| gt_loci_used.txt | Lista dei loci | cartella "result" |
Il file in formato newick (.nwk) contiene tutti i dati dell'albero e può essere visualizzato tramite SPREAD o un altro software esterno per la visualizzazione di dendrogrammi o grafici di distanza.