Piattaforma GenPat, Wiki

Topics
Topics

Glossario dei metadati

Nella tabella in basso sono riportate le colonne del modello dei metadati. Per ogni colonna del template scaricabile viene elencato il tipo di metadato richiesto e ne viene data una descrizione e una guida per la compilazione del modello.

Per una spiegazione sui limiti e le richieste riguardanti il file dei metadati e dei file da caricare, si faccia riferimento alla pagina Regole metadati e zip.

Nota: ogni profilo può effettuare upload di tipi specifici tra official e research (si veda la riga metadata_type nella tabella in basso). Il sistema non accetterà upload di tipi diversi da quelli consentiti a quel profilo.

Titolo campo TSV Metadato Descrizione Obbligatorio
code Codice campione Codice identificativo campione nel sistema del data provider si
species Specie patogeno Indicare la specie del patogeno con codifica GENPAT si
material Materiale Indicare il materiale del campione con codifica GENPAT si
sampling_point Luogo Prelievo Indicare un codice di Luogo Prelievo presente in GENPAT. In caso di campioni ufficiali è possibile inviare il codice istat del comune si
sampling_point_address Luogo Prelievo Indirizzo. Da usare in caso sia stat modalita_invio=semplificata no
sampling_point_note Luogo Prelievo Utilizzare per indicare il tipo di struttura. In caso modalita_invio=semplificata no
sampling_date Data prelievo Utilizzare dettaglio della data al giorno si
matrix Matrice di isolamento Utilizzare codice EFSA FOODEX2 della matrice di isolamento. E' necessario specificare almeno il codice FOODEX2 base per alimento, mangimi, animale e ambiente. In particolare: Food (A0B6Z), Feed (A0BB9), Animals (A04SF), Environment (A0C5Y) si
host Specie host Utilizzare codice EFSA FOODEX2. Specie dell’animale ospite. Da utilizzare in caso di matrice animale no
note Note aggiuntive Testo libero opzionale. Utile a descrivere situazioni di anomalia o deviazioni no
md5_file_r1 file rawreads MD5 checksum del file R1 delle raw reads o del singolo file in caso di sequenziamento single-end Obbligatorio in caso di read_format=fasta e tipo di invio = Ufficiale
md5_file_r2 file rawreads MD5 checksum del file R2 delle raw reads Obbligatorio in caso di sequenziamento pair-end e di read_format=fasta e tipo di invio = Ufficiale
filename1 file rawreads Nome file fasta in caso read_format=fasta, oppure nome file R1 delle raw reads o del singolo file in caso di sequenziamento single-end. In caso il campo code rappresenti un prefisso del nome file, questo campo può essere evitato. Esempi di nomi dei files corrispondenti ai diversi pattern con code="code": read_format=illumina_paired: "codeR1.fastq.gz" read_format=fastq_singleend: "code.fastq.gz" read_format=fasta: "code.fasta" no
filename2 file rawreads Nome file R2 in caso di sequenziamento pair-end. In caso il campo code rappresenti un prefisso del nome file, questo campo può essere evitato. Esempi di nomi dei files corrispondenti ai diversi pattern con code="code": read_format=illumina_paired: "codeR2.fastq.gz" no
file_format Tipo di file inviato Può assumere uno dei valori: fasta, fastq si
seq_type Tecnologia di sequenziamento Può assumere uno dei valori: "illumina_paired", "ion", "nanopore". Obbligatorio per tipo di invio = Ufficiale conditional
metadata_type Tipo di metadato inviato. Vengono eseguite validazioni diverse sui dati in base a questo campo Può assumere il valore: "official" o "research" si