Piattaforma GenPat, Wiki

Topics
Topics

Panaroo

Introduzione

Panaroo elabora il pan-genome in matrici di presenza/assenza dei geni annotati nei campioni, a partire dall'annotazione funzionale del genoma, effettuata da Prokka.

Per approfondimenti sul funzionamento di Panaroo si rimanda alla guida ufficiale.

Pagina GitHub di Panaroo: https://github.com/gtonkinhill/panaroo

uml diagram

Lancia analisi Panaroo

Una volta selezionata l'analisi Panaroo nella pagina dedicata al lancio di analisi, il sistema passerà ad un'interfaccia di conferma: non vi è necessità di scegliere il tool, in quanto l'analisi è specifica per l'uso di Panaroo - An updated pipeline for pangenome investigation.

Nell'interfaccia per la selezione dell'input è possibile confermare l'input per il programma: Panaroo è progettato per l'elaborazione degli output di Prokka; è necessario quindi usare come input i file di annotazione da 4AN_genes. Poichè non vi è possibilità di scelta, il campo è precompilato e non è necessario alcun intervento da parte dell'utente.

Dopo aver lanciato l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di verificare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei file dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results è possibile trovare 2 sotto-cartelle:

  • meta: ("metadata") in cui vengono salvati i file di log e di configurazione del processo eseguito.
  • result: in cui sono salvati i file con i risultati prodotti dall'analisi.

La tabella in basso presenta la lista dei principali file generati da Panaroo, insieme ad alcune informazioni utili.

Ulteriori informazioni sui file di output di Panaroo sono reperibili nella guida ufficiale agli output di Panaroo.

File Descrizione Posizione
combined_DNA_CDS.fasta file FASTA con le sequenze nucleotidiche dei geni annotati e di quelli identificati da Panaroo cartella "result"
combined_protein_CDS.fasta file fasta con le sequenze aminoacidiche prodotte dai geni annotati e di quelli identificati da Panaroo cartella "result"
combined_protein_GFF3cdhit_out.txt log della fase CD-HIT di Panaroo cartella "result"
combined_protein_cdhit_out.txt.clstr informazioni sui cluster da CD-HIT cartella "result"
core_alignment_header.embl cartella "result"
core_gene_alignment.aln file di allineamento cartella "result"
final_graph.gml grafico del pan-genome cartella "result"
gene_data.csv tabella .csv delle corrispondenze tra sequenze dei geni annotati e i codici usati internamente da Panaroo cartella "result"
gene_presence_absence.Rtab matrice binaria di presenza/assenza dei geni nei campioni cartella "result"
gene_presence_absence.csv file .csv che descrive la presenza dei geni nei campioni cartella "result"
gene_presence_absence_roary.csv file .csv che descrive la presenza dei geni nei campioni, con più informazioni (sul modello di Roary) cartella "result"
pan_genome_reference.fa reference pan-genome, in formato FASTA, per tutti i geni rinvenuti nel dataset cartella "result"
pre_filt_graph.gml grafico del pan-genome grezzo cartella "result"
struct_presence_absence.Rtab matrice binaria che descrive la presenza/assenza di eventi di riarrangiamento del genoma cartella "result"
summary_statistics.txt file riassuntivo delle statistiche cartella "result"

Per la visualizzazione del grafico prodotto da Panaroo, gli autori del programma consigliano l'uso di Cytoscape. Ulteriori informazioni sulla visualizzazione del grafico del pan-genome sono disponibili nella sezione della documentazione ufficiale di Panaroo.