Skip to Content

Che cosa sono i dati genomici?

I dati genomici sono il prodotto combinato degli studi di una crescente rete di biologi, genetisti e data scientist di tutto il mondo. Questi scienziati e professionisti cercano risposte sulla struttura, la funzione, l'evoluzione, la mappatura e la modifica del DNA, dei geni e del genoma umano.

Le loro scoperte stanno portando a risultati all'avanguardia nella medicina, nel controllo delle malattie e nel data storage. I dati della genomica aiutano la comunità scientifica a comprendere e svelare le strutture chimiche che sono alla base della vita.

Cosa significa genomica?

In breve, la genomica è un termine relativamente recente che si riferisce allo studio del genoma. Tuttavia, per fornire una descrizione esaustiva della genomica e dei dati genomici, occorre innanzitutto definire quattro termini chiave:

  • Cellule
  • DNA
  • Geni
  • Genomi

Che cosa sono le cellule?

Le cellule sono gli elementi costitutivi della vita. Sono unità microscopiche che contengono tutti gli strumenti necessari per alimentarsi e riprodursi. Possono anche collaborare con altre cellule per costruire ossa, sangue, muscoli, pelle e tutti gli altri organi del nostro corpo. Le cellule si costruiscono e agiscono in base alle istruzioni del DNA. 

Che cos'è il DNA?

Il DNA è un composto chimico che contiene tutte le istruzioni di cui un organismo vivente ha bisogno per svilupparsi. Ogni essere vivente ha il proprio DNA, ma gli elementi costitutivi fondamentali del DNA sono quattro sostanze chimiche rappresentate da quattro singole lettere.

  • Adenina (A)
  • Citosina (C)
  • Guanina (G)
  • Timina (T)

La struttura del DNA è incredibilmente complessa. È simile a un libro, con milioni di lettere combinate per formare parole, frasi e paragrafi. Una copia del DNA umano contiene 3 miliardi di combinazioni distinte delle quattro lettere che ne rappresentano gli elementi costitutivi. Quasi ogni cellula del corpo contiene una copia del DNA, che fornisce decine di migliaia di istruzioni su come costruire il corpo attraverso i geni.

Che cos'è un gene?

Un gene è una sequenza specifica e unica del lungo filamento di DNA che crea i tratti ereditari, come il colore degli occhi. In biologia, il gene è considerato l'unità di base dell'ereditarietà.

Se paragoniamo il DNA a tutte le lettere con cui il corpo deve scrivere, un gene potrebbe essere una parola. Alcuni sono più corti di altri e alcuni hanno effetti più complicati sul corpo. Alcuni geni hanno poche centinaia di combinazioni di lettere del DNA, mentre altri ne hanno più di 2 milioni.

Si stima che il corpo umano abbia tra i 20.000 e i 25.000 geni. Lo studio dei geni è chiamato genetica.

Che cos'è la genomica?

La genomica e la genetica sono diverse, ma correlate. La genetica si concentra sui singoli geni e sull'ereditarietà dei tratti, mentre la genomica cerca di caratterizzare tutti i geni di un organismo e il modo in cui si relazionano tra loro e influenzano il corpo.

Un genoma è l'insieme di tutti i geni di una persona. Se immaginiamo i geni come parole, la genomica può essere considerata come un'analisi dell'intero libro volta a comprendere le interazioni reciproche tra capitoli, personaggi e temi.

Che cos'è l'analisi dei dati genomici?

L'analisi dei dati genomici è un campo di studio che si basa sulle tecnologie computazionali per analizzare e visualizzare il genoma e le relative informazioni. L'analisi dei dati genomici comprende l'elaborazione di enormi quantità di dati alla ricerca di relazioni tra i geni e quindi memorizza non solo tutti i dati raw, ma anche tali relazioni e il contesto.

La comprensione della genetica umana e della genomica non si limita alla scoperta dell'esistenza di 3 miliardi di combinazioni di quattro lettere chimiche in una sequenza specifica e ordinata (scoperta che risale al 2003), ma è molto più complessa. La genomica riguarda anche la scoperta di ciascuna delle quasi 25.000 combinazioni di quei 3 miliardi di lettere, del loro comportamento e del modo in cui si relazionano tra loro e interagiscono con l'ambiente.

Uno degli aspetti più interessanti dell'analisi dei dati genomici riguarda il fatto che la nostra capacità di visualizzare e sequenziare le lettere del DNA si è sviluppata più rapidamente della capacità di decifrare e capire cosa fanno effettivamente le lettere. L'analisi dei dati genomici è, quindi, un tentativo di utilizzare le innumerevoli informazioni che abbiamo sul linguaggio dei nostri geni e di tradurle in medicina e altro.

L'analisi dei dati genomici è un'impresa imponente sotto molti punti di vista, oltre a essere uno dei settori dei Big Data in più rapida crescita al mondo. Potrebbe generare fino a 40 exabyte di dati entro il 2025. Per dare un'idea delle dimensioni dei dati genomici, se un gigabyte è la dimensione della terra, un exabyte è quasi la dimensione del sole. I dati genomici sarebbero pari a 40 soli.

Perché studiamo la genomica?

La genetica svolge un ruolo cruciale in molte delle principali cause di morte negli Stati Uniti. Le malattie cardiache, il diabete e il cancro sono tutti causati da fattori che hanno a che fare con i diversi geni presenti nel nostro corpo e con le relazioni tra di essi. Studiamo la genomica per cercare di prevenire alcune delle cause più diffuse di malattia e morte.

La genomica ci aiuta a comprendere meglio come funziona il nostro corpo, in modo da poter aiutare un maggior numero di persone a farlo funzionare meglio e più a lungo. Dal punto di vista genetico, gli esseri umani sono identici al 99,9%. Questo significa che le scoperte genomiche saranno quasi certamente applicabili a quasi tutti gli abitanti del pianeta.

Perché è importante che le banche dati genomiche siano condivise tra i ricercatori?

La condivisione dei dati genomici e delle banche dati genomiche tra i ricercatori è importante per ottenere risultati più precisi con una maggiore rapidità. Man mano che un numero sempre più elevato di ricercatori esplora le relazioni tra geni e malattie, la condivisione dei risultati e il coinvolgimento di altre persone nella ricerca possono portare a risultati migliori in termini di conoscenze, prodotti e procedure che migliorano la salute umana.

11/2024
Enhance Data Lakehouse Infrastructure
Pure Storage® has partnered with Dremio, the unified data lakehouse platform, to help enterprises build a future-proof, scalable, and efficient data infrastructure.
Solution brief
3 pagine
CONTATTACI
Domande?

Hai domande o commenti sui prodotti o sulle certificazioni di Pure?  Siamo qui per aiutarti.

Prenota una demo

Prenota una demo per vedere come puoi trasformare i tuoi dati in risultati concreti con Pure. 

Telefono: +39 02 9475 9422

Media: pr@purestorage.com

 

Pure Storage Italia

Spaces c/o Bastioni di Porta Nuova, 21

Milano, 20121

+39 02 9475 9422

italia@purestorage.com

CHIUDI
Il browser che stai usando non è più supportato.

I browser non aggiornati spesso comportano rischi per la sicurezza. Per offrirti la migliore esperienza possibile sul nostro sito, ti invitiamo ad aggiornare il browser alla versione più recente.