Piattaforma GenPat, Wiki

Topics
Topics

4TY_ML

Introduzione

L'analisi ML (Machine Learning) consente di effettuare la predizione della sorgente alimentare (Source Attribution) di L. monocytogenes. L'analisi usa un classificatore binario (sorgenti predette: "meat" o "non-meat"), prodotto come deliverable del progetto di ricerca corrente.

uml diagram

Lancia analisi 4TY_ML

L'analisi 4TY_ML prevede l'uso di un modello già pre-addestrato come "source-classifier", disponibile attualmente solo per L. monocytogenes. La classificazione per fenotipo sarà binaria: il modello è addestrato per predire quali campioni, tra le L. monocytogenes selezionate come input, provengono da una matrice alimentare "carne" e quali da una matrice "non carne". La predizione si basa sulla matrice di alleli da cgMLST.

L'interfaccia per la selezione dell'input mette a disposizione la modalità di selezione input avanzata, per permettere l'utilizzo di input processati da metodi diversi, usati a monte nel flusso di analisi.

I possibili input possono provenire da:

Entrambi i tipi di input prevedono l'uso di chewBBACA come software di esecuzione; inoltre, per 4TY_cgMLST, è possibile usare alternativamente la versione 2.8.4 con schema Pasteur o 2.8.5 con schema crc32.

Una volta lanciata l'analisi, la pagina genererà un link alla sezione Controllo analisi, per permettere di visualizzare lo stato del processo. L'utente verrà notificato dal sistema sia una volta lanciata con successo l'analisi, sia al termine dell'esecuzione.

Cartella dei risultati

Per consultare la guida sul download dei file dalla piattaforma si faccia riferimento all'apposita pagina.

La cartella dei risultati, Result folder, è accessibile cliccando sul link presente all'interno della scheda dell'analisi, nella sezione Dati risultato. All'interno della conseguente cartella results, è possibile trovare 2 sotto-cartelle:

  • meta: (metadati) in cui vengono salvati i file di log e di configurazione del processo eseguito;
  • result: in cui sono salvati i files con i risultati prodotti dall'analisi.

Nella tabella seguente sono riportate la posizione e una breve descrizione dei principali file prodotti dall'analisi.

File Descrizione Posizione
DSXXXXXXXX-DTXXXXXX_ID_source_classifier.tsv tabella .tsv con i risultati della predizione per il campione cartella "result"
metadata.csv tabella .csv dei metadati dei campioni usati come input cartella "results"

Visualizzazione dei risultati

I risultati dell'analisi 4TY_ML possono essere visualizzati anche tramite un'apposita pagina dei controlli qualità, ovvero Controlli qualità della classificazione tramite ML, disponibile sotto Report > Dettaglio > Controlli qualità/Metriche > Controlli qualità della classificazione tramite ML del menù di navigazione laterale.