Piattaforma GenPat, Wiki

Topics
Topics

Upload PT Genpat

Istruzioni per l'upload

Per effettuare l'upload delle sequenze del PT Genpat 2025, la procedura base è la stessa dell'upload su GenPat, come illustrato dal video in basso.

Le uniche differenze fondamentali rispetto ad un normale upload sono le seguenti:

  • È necessario entrare con profilo LAB Campylobacter;
  • È necessario fornire i metadati specifici per il PT indicati nella tabella dei metadati richiesti;
  • È necessario fornire un file zip contenente le reads grezze da caricare. Queste dovranno essere rinominate come: "Codice + _R1.fastq.gz" (nel caso di illumina paired è necessario fornire entrambi i files R1 e R2; entrambi devono essere rinominati). Esempio: LABXX-GENPAT25-YY_R1.fastq.gz e LABXX-GENPAT25-YY_R2.fastq.gz. Si vedano le indicazioni nella tabella dei metadati richiesti.

Genpat-upload_PT.mp4

Si fa notare che:

  1. le reads dovranno necessariamente essere compresse in formato gz ed avere quindi estensione .fastq.gz.

  2. la piattaforma non opera alcuna compressione: come specificato in questa e nelle altre pagine della guida sull'upload, il file da caricare per effettuare l'upload deve essere un file .zip, già compresso autonomamente dall'utente sul proprio computer, usando uno strumento di compressione a sua scelta.

  3. l'upload per il PT2025 può essere effettuato solo da utenti con profilo "LAB Campylobacter" che ne abbiano fatto richiesta.

File dei metadati

Qui sotto sono disponibili i modelli dei files dei metadati da scaricare:

Descrizione dei metadati richiesti

Nella seguente tabella vengono elencate le colonne presenti da riempire nel file dei metadati, spiegandone il significato ed il dato atteso, per ogni campione sottomesso.

Metadato Dato atteso Spiegazione
code Codice nel formato LABXX-GENPAT25-YY il codice indica l'identificativo del laboratorio (LABXX, dove XX è un codice numerico progressivo a 2 cifre), il PT (Genpat 2025), il numero del campione (YY, dove YY è un codice numerico progressivo a 2 cifre, corrispondente al codice dell'aliquota di DNA ricevuta)
species uno dei due codici 110341G o 110343G il campo è dedicato all'indicazione della specie dei campioni, che va inserita come codice corrispondente, ovvero 110341G per Campylobacter jejuni e 110343G per Campylobacter coli
note stringa di testo il campo serve ad accogliere una qualunque nota testuale riguardo il campione e il suo riempimento è opzionale
metadata_type stringa di testo il campo deve contenere la stringa pt2025
file_format stringa di testo il campo deve contenere una delle 2 stringhe di testo fasta o fastq, per indicare il formato del file caricato
seq_type stringa di testo se il campo file_format è valorizzato con fastq questo campo è obbligatorio e deve contenere uno dei seguenti valori in base al sequenziatore utilizzato: ion (Iontorrent), nanopore, illumina_paired (Illumina short reads, paired-end technology)

Note Aggiuntive

Per approfondimenti sul procedimento di upload manuale si rimanda alla pagina Wiki di GenPat: Upload manuale.

Per approfondimenti sulla costruzione del file dei metadati si rimanda alle pagine Wiki di GenPat sui metadati: preparazione e caricamento dei metadati e Regole metadati e zip.