Delphi‑2M, il nuovo modello di IA che prevede la salute futura, è il frutto di una collaborazione tra il European Molecular Biology Laboratory (EMBL-EBI) e il German Cancer Research Center (DKFZ), con il contributo di altri enti europei, ed è descritto in uno studio recentemente pubblicato sulla rivista Nature. Questo modello rivela il potenziale per prevedere, non solo le condizioni mediche che un individuo potrebbe sviluppare nei prossimi anni, ma anche la tempistica probabile con cui esse potrebbero manifestarsi.

Complessità e funzionamento

Delphi‑2M è un modello generativo basato su architetture simili a quelle dei modelli di linguaggio (“transformer”), ma adattato per operare non su testi, bensì su sequenze temporali di eventi medici.

I dati d’ingresso includono:

Il modello produce come output una previsione probabilistica: non afferma con certezza che una malattia si manifesterà, ma indica quanto è probabile che ciò accada in un certo arco temporale, fino a vent’anni. Si possono anche generare traiettorie “simulate” di salute, ossia scenari futuri per una persona basati sul suo profilo attuale.

Validazione e dati utilizzati

Per realizzare Delphi‑2M, i ricercatori hanno utilizzato come principale fonte il database UK Biobank, con circa 400.000 partecipanti le cui cartelle cliniche sono state rese anonime.

Per test di trasferibilità e robustezza, il modello è stato valutato anche su quasi 1,9‑2 milioni di persone tratte dai registri sanitari nazionali danesi. Non sono state fatte modifiche al modello per questo secondo set di dati: è stato impiegato “così com’è” per verificarne l’efficacia in un altro contesto sanitario.







Dove il modello ha successo

Delphi‑2M raggiunge livelli elevati di accuratezza per le malattie con un decorso prevedibile: problemi cardiovascolari, diabete, talvolta infezioni come la sepsi, sono esempi in cui la capacità predittiva funziona bene.

Inoltre, la modellazione mostra buona trasportabilità: benché ci sia una lieve diminuzione delle prestazioni passando dai dati britannici a quelli danesi, il risultato resta solido per la maggior parte delle malattie considerate.

Limiti attuali

Tuttavia, Delphi‑2M non è perfetto. Alcune condizioni cliniche, specie quelle rare o fortemente influenzate da eventi esterni imprevedibili, risultano più difficili da prevedere con affidabilità.

Altri limiti importanti derivano dai dati stessi:

la popolazione del Biobank ha caratteristiche demografiche che non la rendono perfettamente rappresentativa, ad esempio è più sana, in media più istruita e più ricca di aree geografiche o etniche predominanti, rispetto alla popolazione generale.

certi gruppi di età, in particolare quelli molto anziani, sono scarsamente rappresentati nel set di dati;

molte malattie molto rare non forniscono dati sufficienti per addestrare modelli affidabili.

Uso potenziale

Delphi‑2M potrebbe diventare uno strumento potente per la prevenzione. Permette di identificare persone con elevato rischio di contrarre determinate condizioni negli anni futuri, in modo da intervenire in anticipo con screening mirati, modifiche dello stile di vita, o monitoraggi specifici.

A livello di salute pubblica, modelli come questo possono aiutare a stimare quanti soggetti in una popolazione svilupperanno certe malattie, per pianificare risorse sanitarie: ospedali, specialisti, farmaci.

Con strumenti così potenti sorgono anche sfide significative:

la protezione della privacy : anche se i dati sono anonimizzati, l’uso di traiettorie simulate e la possibilità di incrociare molte variabili accresce il rischio di identificazione indiretta.

la discriminazione : assicuratori o datori di lavoro potrebbero essere tentati di usare queste predizioni nei loro interessi, penalizzando chi ha profili di rischio elevato.

l’uso clinico: bisogna evitare che le previsioni diventino “giudizi” definitivi su una persona, quando invece sono probabilistiche e soggette a errori o bias.

Delphi‑2M è ancora in una fase sperimentale. Secondo i ricercatori, per poterlo utilizzare su larga scala nelle cliniche, per decisioni individuali, serviranno probabilmente alcuni anni: si parla di una finestra di 5‑10 anni per lo sviluppo, la validazione aggiuntiva e l’integrazione con altri tipi di dati (genetica, proteomica, biomarcatori).

Si sta anche lavorando su versioni del modello che utilizzino dati biologici più dettagliati, che potrebbero migliorare la precisione soprattutto per malattie con componenti genetiche o biochimiche complesse.

Inoltre, si studiano forme di sintesi di dati (“synthetic data”) che permettano di preservare la privacy, ma mantenere utilità statistica per l’addestramento dei modelli.

Delphi‑2M rappresenta una pietra miliare nel campo della medicina preventiva: la capacità di prevedere, con un margine temporale che può arrivare a vent’anni, le probabilità che una persona sviluppi una o più malattie, grazie a dati clinici, demografici e di stile di vita. Pur con i limiti intrinseci derivanti da rappresentatività dei dati e accuratezza variabile, il modello apre la porta ad una sanità più proattiva, personalizzata, anticipatrice dei problemi piuttosto che reattiva.

Patricia Iori