Panaroo
Introduzione
Panaroo elabora il pan-genome in matrici di presenza/assenza dei geni annotati nei campioni, a partire dall'annotazione funzionale del genoma, effettuata da Prokka.
Per approfondimenti sul funzionamento di Panaroo si rimanda alla guida ufficiale.
Pagina GitHub di Panaroo: https://github.com/gtonkinhill/panaroo
Lancia analisi Panaroo
Una volta selezionata l'analisi Panaroo nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma: non vi è necessità di scegliere il tool, in quanto l'analisi è specifica per l'uso di Panaroo - An updated pipeline for pangenome investigation.
Nell'interfaccia per la selezione dell'input è possibile confermare l'input per il programma: Panaroo è progettato per l'elaborazione degli output di Prokka; è necessario quindi usare come input i file di annotazione da 4AN_genes. Poichè non vi è possibilità di scelta, il campo è precompilato e non è necessario alcun intervento da parte dell'utente.

Dopo aver lanciato l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di verificare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.
Cartella dei risultati
Per consultare la guida sul download dei file dalla piattaforma si faccia riferimento all'apposita pagina.
La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results è possibile trovare 2 sotto-cartelle:
- meta: ("metadata") in cui vengono salvati i file di log e di configurazione del processo eseguito.
- result: in cui sono salvati i file con i risultati prodotti dall'analisi.
La tabella in basso presenta la lista dei principali file generati da Panaroo, insieme ad alcune informazioni utili.
Ulteriori informazioni sui file di output di Panaroo sono reperibili nella guida ufficiale agli output di Panaroo.
| File | Descrizione | Posizione |
|---|---|---|
| combined_DNA_CDS.fasta | file FASTA con le sequenze nucleotidiche dei geni annotati e di quelli identificati da Panaroo | cartella "result" |
| combined_protein_CDS.fasta | file fasta con le sequenze aminoacidiche prodotte dai geni annotati e di quelli identificati da Panaroo | cartella "result" |
| combined_protein_GFF3cdhit_out.txt | log della fase CD-HIT di Panaroo | cartella "result" |
| combined_protein_cdhit_out.txt.clstr | informazioni sui cluster da CD-HIT | cartella "result" |
| core_alignment_header.embl | cartella "result" | |
| core_gene_alignment.aln | file di allineamento | cartella "result" |
| final_graph.gml | grafico del pan-genome | cartella "result" |
| gene_data.csv | tabella .csv delle corrispondenze tra sequenze dei geni annotati e i codici usati internamente da Panaroo | cartella "result" |
| gene_presence_absence.Rtab | matrice binaria di presenza/assenza dei geni nei campioni | cartella "result" |
| gene_presence_absence.csv | file .csv che descrive la presenza dei geni nei campioni | cartella "result" |
| gene_presence_absence_roary.csv | file .csv che descrive la presenza dei geni nei campioni, con più informazioni (sul modello di Roary) | cartella "result" |
| pan_genome_reference.fa | reference pan-genome, in formato FASTA, per tutti i geni rinvenuti nel dataset | cartella "result" |
| pre_filt_graph.gml | grafico del pan-genome grezzo | cartella "result" |
| struct_presence_absence.Rtab | matrice binaria che descrive la presenza/assenza di eventi di riarrangiamento del genoma | cartella "result" |
| summary_statistics.txt | file riassuntivo delle statistiche | cartella "result" |
Per la visualizzazione del grafico prodotto da Panaroo, gli autori del programma consigliano l'uso di Cytoscape. Ulteriori informazioni sulla visualizzazione del grafico del pan-genome sono disponibili nella sezione della documentazione ufficiale di Panaroo.