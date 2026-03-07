Nel panorama della ricerca scientifica contemporanea, l’incontro tra biologia e intelligenza artificiale sta aprendo prospettive che fino a pochi anni fa sembravano appartenere alla fantascienza. Un passo decisivo in questa direzione è rappresentato da Evo 2, un sistema avanzato di intelligenza artificiale generativa progettato per analizzare e creare sequenze genetiche. Il modello, sviluppato congiuntamente dall’ Arc Institute e dalla Nvidia , con il contributo di ricercatori della Stanford University , della University of California, Berkeley e della University of California, San Francisco , rappresenta una delle applicazioni più potenti dell’IA generativa nel campo delle scienze della vita.

L’importanza di questo progetto è stata ribadita anche dalla pubblicazione dei risultati su Nature, una delle riviste scientifiche più autorevoli al mondo. Con Evo 2, gli scienziati dispongono di uno strumento capace non solo di interpretare il linguaggio genetico, ma anche di intervenire su di esso, suggerendo modifiche, identificando anomalie e persino progettando nuove sequenze biologiche.

Un modello di IA addestrato sul codice della vita

Per comprendere la portata dell’innovazione introdotta da Evo 2 è utile fare un paragone con i modelli linguistici utilizzati nel campo dell’intelligenza artificiale. Se sistemi come ChatGPT sono addestrati su enormi quantità di testo per comprendere e generare linguaggio umano, Evo 2 è stato addestrato su una mole altrettanto imponente di dati genetici.

Il “vocabolario” del modello non è composto da parole e frasi, ma dai quattro nucleotidi che costituiscono il DNA. Queste unità fondamentali – rappresentate dalle lettere A, T, C e G – formano sequenze che racchiudono le informazioni biologiche necessarie alla vita. Analizzando schemi, correlazioni e variazioni all’interno di miliardi di queste lettere, il sistema è in grado di riconoscere regole e strutture che governano il funzionamento dei genomi.

L’addestramento di Evo 2 si basa su una collezione senza precedenti di dati: circa 9mila miliardi di nucleotidi provenienti da oltre 128mila genomi appartenenti a organismi differenti. Il dataset comprende specie viventi e specie ormai scomparse, offrendo al modello una panoramica estremamente ampia della diversità genetica presente in natura.







Dall’analisi alla progettazione di genomi

Una delle capacità più sorprendenti di Evo 2 è la possibilità di non limitarsi all’analisi delle sequenze genetiche, ma di generare nuove configurazioni di DNA. In altre parole, il sistema può suggerire come riscrivere segmenti genetici per ottenere determinate caratteristiche biologiche.

Secondo i ricercatori coinvolti nel progetto, il modello è già in grado di progettare genomi completi con dimensioni paragonabili a quelli di batteri relativamente semplici. Questo non significa che tali organismi possano essere immediatamente creati in laboratorio, ma dimostra il potenziale dell’intelligenza artificiale nel supportare la progettazione biologica.

La capacità di generare sequenze plausibili deriva dal fatto che Evo 2 ha appreso le regole statistiche e strutturali che governano il DNA. Analizzando miliardi di esempi, il sistema riesce a prevedere quali combinazioni di nucleotidi risultino compatibili con funzioni biologiche specifiche.

Individuare le mutazioni responsabili delle malattie

Un’altra applicazione di grande interesse riguarda la medicina genetica. Molte patologie sono causate da alterazioni anche minime nella sequenza del DNA. Individuare queste mutazioni e comprenderne gli effetti è uno dei compiti più complessi della genomica moderna.

Evo 2 è progettato per affrontare proprio questa sfida. Il modello può confrontare sequenze genetiche differenti, individuare variazioni sospette e stimare l’impatto che queste potrebbero avere sul funzionamento delle cellule. Ciò potrebbe accelerare in modo significativo la ricerca sulle malattie ereditarie e sulle condizioni legate a mutazioni rare.

Tradizionalmente, l’analisi delle varianti genetiche richiede lunghi processi di confronto e interpretazione. Un sistema di intelligenza artificiale capace di analizzare enormi quantità di dati in tempi ridotti potrebbe trasformare radicalmente questo processo, offrendo ai ricercatori uno strumento potente per identificare rapidamente i cambiamenti più critici.

La realizzazione di Evo 2 è il risultato di un ampio sforzo collaborativo che coinvolge istituzioni accademiche e aziende tecnologiche. L’Arc Institute, centro di ricerca indipendente focalizzato sulla biologia di frontiera, ha coordinato il progetto insieme a Nvidia, che ha fornito infrastrutture di calcolo e competenze nel campo dell’intelligenza artificiale.

Il contributo delle università partner è stato altrettanto decisivo. I ricercatori della Stanford University e delle università californiane di Berkeley e San Francisco hanno messo a disposizione competenze avanzate in genetica, biologia molecolare e bioinformatica.

Il ruolo dei big data nella genetica moderna

Il successo di Evo 2 dimostra anche quanto i big data siano diventati centrali nella biologia moderna. Negli ultimi due decenni il costo del sequenziamento del DNA è diminuito drasticamente, rendendo possibile la raccolta di enormi quantità di informazioni genetiche.

Questa abbondanza di dati ha creato nuove opportunità ma anche nuove sfide. Interpretare milioni di sequenze genetiche richiede strumenti computazionali sofisticati, capaci di individuare schemi nascosti e correlazioni complesse.

Nel campo della biotecnologia, la progettazione di nuovi genomi potrebbe portare alla creazione di microrganismi capaci di produrre farmaci, enzimi industriali o biocarburanti con maggiore efficienza. Anche l’agricoltura potrebbe beneficiare di questi strumenti, attraverso lo sviluppo di colture più resistenti ai cambiamenti climatici o alle malattie.

I limiti attuali della tecnologia

Nonostante le sue capacità avanzate, Evo 2 non rappresenta una soluzione definitiva a tutti i problemi della genetica. Come qualsiasi modello di intelligenza artificiale, il sistema dipende dalla qualità e dalla rappresentatività dei dati utilizzati durante l’addestramento.

Inoltre, la biologia reale è estremamente complessa e coinvolge fattori che vanno oltre la semplice sequenza del DNA. L’espressione dei geni, le interazioni cellulari e l’influenza dell’ambiente giocano un ruolo fondamentale nel determinare il funzionamento degli organismi.

Per questo motivo, i risultati prodotti da Evo 2 devono essere interpretati e verificati attraverso esperimenti di laboratorio. L’intelligenza artificiale non sostituisce il lavoro degli scienziati, ma può diventare un potente alleato nel guidare nuove ipotesi e accelerare la scoperta scientifica.

Se queste tecnologie continueranno a svilupparsi con la stessa rapidità osservata negli ultimi anni, è probabile che assisteremo a una vera e propria rivoluzione nella comprensione e nella manipolazione dei sistemi biologici. Un cambiamento che potrebbe avere effetti profondi sulla medicina, sull’industria e sulla nostra stessa concezione della vita.