Upload PT Genpat
Istruzioni per l'upload
Per effettuare l'upload delle sequenze del PT Genpat 2025, la procedura base è la stessa dell'upload su GenPat, come illustrato dal video in basso.
Le uniche differenze fondamentali rispetto ad un normale upload sono le seguenti:
- È necessario entrare con profilo LAB Campylobacter;
- È necessario fornire i metadati specifici per il PT indicati nella tabella dei metadati richiesti;
- È necessario fornire un file zip contenente le reads grezze da caricare. Queste dovranno essere rinominate come: "Codice +
_R1.fastq.gz" (nel caso di illumina paired è necessario fornire entrambi i files R1 e R2; entrambi devono essere rinominati). Esempio:LABXX-GENPAT25-YY_R1.fastq.gzeLABXX-GENPAT25-YY_R2.fastq.gz. Si vedano le indicazioni nella tabella dei metadati richiesti.
Si fa notare che:
le reads dovranno necessariamente essere compresse in formato
gzed avere quindi estensione.fastq.gz.la piattaforma non opera alcuna compressione: come specificato in questa e nelle altre pagine della guida sull'upload, il file da caricare per effettuare l'upload deve essere un file .zip, già compresso autonomamente dall'utente sul proprio computer, usando uno strumento di compressione a sua scelta.
l'upload per il PT2025 può essere effettuato solo da utenti con profilo "LAB Campylobacter" che ne abbiano fatto richiesta.
File dei metadati
Qui sotto sono disponibili i modelli dei files dei metadati da scaricare:
Descrizione dei metadati richiesti
Nella seguente tabella vengono elencate le colonne presenti da riempire nel file dei metadati, spiegandone il significato ed il dato atteso, per ogni campione sottomesso.
| Metadato | Dato atteso | Spiegazione |
|---|---|---|
| code | Codice nel formato LABXX-GENPAT25-YY |
il codice indica l'identificativo del laboratorio (LABXX, dove XX è un codice numerico progressivo a 2 cifre), il PT (Genpat 2025), il numero del campione (YY, dove YY è un codice numerico progressivo a 2 cifre, corrispondente al codice dell'aliquota di DNA ricevuta) |
| species | uno dei due codici 110341G o 110343G |
il campo è dedicato all'indicazione della specie dei campioni, che va inserita come codice corrispondente, ovvero 110341G per Campylobacter jejuni e 110343G per Campylobacter coli |
| note | stringa di testo | il campo serve ad accogliere una qualunque nota testuale riguardo il campione e il suo riempimento è opzionale |
| metadata_type | stringa di testo | il campo deve contenere la stringa pt2025 |
| file_format | stringa di testo | il campo deve contenere una delle 2 stringhe di testo fasta o fastq, per indicare il formato del file caricato |
| seq_type | stringa di testo | se il campo file_format è valorizzato con fastq questo campo è obbligatorio e deve contenere uno dei seguenti valori in base al sequenziatore utilizzato: ion (Iontorrent), nanopore, illumina_paired (Illumina short reads, paired-end technology) |
Note Aggiuntive
Per approfondimenti sul procedimento di upload manuale si rimanda alla pagina Wiki di GenPat: Upload manuale.
Per approfondimenti sulla costruzione del file dei metadati si rimanda alle pagine Wiki di GenPat sui metadati: preparazione e caricamento dei metadati e Regole metadati e zip.