Fasi del sistema di lancio analisi
Il sistema per il lancio di analisi prevede una suddivisione logica in 3 fasi:
- Campioni (selezione dei campioni);
- Tools (scelta del tipo di analisi e degli strumenti di bionformatica);
- Inputs (selezione dell'input);
Una guida rapida al lancio di analisi è disponibile nella pagina Wiki di introduzione a "Lancia analisi", in cui è presente anche un video dimostrativo dell'intero procedimento.
Nota: Per questioni di privacy e sicurezza dei dati, alcuni dei video presenti nella pagina sono stati realizzati nell'applicativo demo Cohesive, pertanto l'interfaccia può presentare alcune marginali differenze.
In questa sezione del Wiki, vengono esposte le 3 fasi: Campioni, Tools e Inputs.
Fase 1: Campioni
Affinchè si possa procedere con la scelta dell'analisi, è prima necessario fornire al sistema una raccolta di codici. Tale fase è necessaria per preparare il lancio di un'analisi su file associati ad ognuno dei campioni specificati, (ad esempio, le read grezze dei campioni, nel caso del trimming oppure gli assembly fasta, nel caso di cgMLST con chewBBACA). L'analisi selezionata verrà eseguita per ogni codice specificato.
Le scelte a disposizione dell'utente per la selezione dei codici sono il carrello o un tag. Un tag è una raccolta statica, definita e salvata dall'utente, contenente codici di campioni. Il carrello consente una raccolta transiente di codici, definita dall'utente e che può essere abilitata, come funzione di filtro, tramite attivazione del carrello. Nel caso l'utente scelga di fornire i codici per il lancio analisi tramite carrello, esso viene automaticamente attivato, acquisendo priorità su qualsiasi eventuale tag attivo. La disattivazione del carrello riporta la piattaforma allo stato antecedente la sua attivazione.
Quando non vi sono campioni nel carrello o un tag attivo, è possibile cliccare sul link preposto alla selezione del tag (pulsante Attiva tag) o al riempimento del carrello (pulsante Gestisci carrello) dalle apposite pagine.
E' disponibile anche una funzionalità per il riempimento rapido del carrello tramite l'uso di una lista di codici o di un file CSV.
Il breve video seguente mostra l'esecuzione della fase di selezione dei codici tramite tag.
Fase 2: Tools
La fase denominata Tools mette a disposizione dell'utente un'interfaccia per la scelta dell'analisi (o della pipeline) da eseguire sui campioni precedentemente selezionati e, successivamente, dello stumento bioinformatico con il quale si desidera affettuare l'analisi. Le tipologie di analisi disponibili in piattaforma sono elencate come riquadri che indicano nome e tipologia di appartenenza. Esse, tuttavia, possono anche essere filtrate per categoria, visualizzate come schema ad albero o vagliate tramite l'apposito campo di ricerca.
A seguito della selezione dell'analisi, all'utente viene proposta una schermata di conferma che offre alcune informazioni utili sull'analisi scelta e sul programma bioinformatico selezionato. In questa pagina, l'utente potrà scegliere il tool (anche detto metodo) bioinformatico dal menù a tendina della sezione Seleziona metodo, se in piattaforma sono presenti due o più tools bioinformatici che possono eseguire la stessa analisi.
Il breve video che segue mostra la selezione di analisi e tool.
Fase 3: Input
L'ultima fase necessaria per terminare il lancio di un'analisi è quella di definizione degli input. Con la prima fase (Campioni) sono stati forniti i codici dei campioni di interesse ma rimane da specificare quali file usare, tra quelli associati ad ognuno di tali campioni, per l'analisi selezionata; ad esempio, un'analisi come il "trimming" usa, come input, le read grezze dei campioni mentre il clustering con GrapeTree necessita dei file tabulari da cgMLST. Nel primo caso verranno selezionati i file FASTQ delle read dei campioni inseriti nella fase 1 laddove, nel secondo caso, verranno selezionati i corrispondenti files dei profili allelici prodotti da chewBBACA.
Questa fase richiede, dunque, che i file necessari per il lancio di un'analisi debbano essere in precedenza prodotti ed importati, (ciò significa che, ad esempio, non sarebbe possibile lanciare GrapeTree su campioni sui quali non sia stato eseguito prima chewBBACA).
I campi dell'interfaccia, di questa ultima fase, sono già precompilati con l'input standard per il tool bioinformatico scelto; l'intervento dell'utente, pertanto, sarà necessario solo nel caso in cui vi sia più di un input idoneo disponibile. Dalla stessa interfaccia, sarà possibile specificare alcune opzioni, se disponibili e, per alcune analisi, accedere alla modalità di lancio avanzata.
Il breve video che segue mostra la fase di selezione dell'input durante il lancio di un'analisi.
Input: modalità avanzata
I campioni nella piattaforma possono essere identificati da due stringhe:
- .TE. (campioni sequenziati);
- .EXT. (campioni importati manualmente o da database esterno).
Alcuni tool bioinformatici nella piattaforma devono ricevere una specifica istruzione affinchè possano utilizzare, come input, i file appartenenti ad entrambe le tipologie.
Per permettere di fornire tale istruzione, la terza ed ultima fase del sistema di lancio analisi presenta un interruttore per il passaggio dalla "Modalità di base" di selezione dell'input alla "Modalità avanzata", la quale consente la scelta tramite caselle di spunta.
Il breve video che segue mostra l'applicazione della Modalità avanzata su uno dei tool per i quali è disponibile: la pipeline CFSAN.
Selezione di reference multipli
Alcune analisi, (ad esempio il mapping eseguito con Ivar o le pipeline che lo comprendono, come Mapping dei virus segmentati), prevedono la possibilità di selezionare più di un reference. La selezione avviene aprendo la finestra pop-up dei genomi reference, attraverso la quale sarà possibile scegliere un qualunque numero di file, spuntando le caselle corrispondenti. La ripetizione di tale processo non sovrascriverà i reference immessi in precedenza: essi verranno semplicemente aggiunti alla lista.
La lista dei reference selezionati può essere azzerata (tasto Pulisci); inoltre, i reference in essa presenti possono essere rimossi singolarmente attraverso l'icona
.
La lista può inoltre essere ordinata, facendo uso degli appositi tasti a forma di freccia.
Nota: l'ordine dei reference nella lista influisce sul risultato finale del mapping multi-reference. Ordinare per primi i genomi reference principali.
Il video seguente mostra come interagire con le opzioni per la selezione di reference multipli.