Pangenomica: una piattaforma italiana sfida il limite del genoma di riferimento - GenoGra

Pangenomica: la piattaforma di GenoGra sfida il limite del genoma di riferimento

di Michela Moretti
Immagine di Michela Moretti

Michela Moretti

Perché ne stiamo parlando
Lanciata a Londra durante il Festival of Genomics, la piattaforma sviluppata dalla startup italiana utilizza un modello innovativo per analizzare la variabilità genetica in modo più accurato e scalabile rispetto agli approcci tradizionali. Possibili sviluppi futuri nella diagnostica.

Getting your Trinity Audio player ready...

È stata lanciata oggi, 28 gennaio, a Londra, in occasione del Festival of Genomics & Biodata, la piattaforma made in Italy progettata per superare uno dei limiti strutturali dell’analisi genomica: interpretare la complessità del DNA attraverso un unico genoma di riferimento.

Nata dalle menti di ingegneri e ricercatori formatisi al Politecnico di Milano e in ambito accademico internazionale, è il fiore all’occhiello di GenoGra, startup deep-tech italiana, nata nel 2023 a Milano e specializzata in pangenomica e genomica computazionale: un sistema informatico di nuova generazione progettato per sfruttare appieno il potenziale dei dati prodotti dalle tecnologie di Next Generation Sequencing. Un approccio che replica in modo più fedele la realtà biologica rispetto alle sequenze genomiche tradizionali e promette un salto di qualità nell’accuratezza, nella scalabilità e nella comprensione del genoma.

A dirigere la startup è Guido Walter Di Donato, ceo e co-fondatore di GenoGra, ingegnere biomedico con un background nella genomica computazionale e nel trasferimento tecnologico.
Lo abbiamo intervistato per capire perché la pangenomica rappresenta la grande innovazione nel campo della genomica, e che cosa significa trasformare questo tipo di ricerca scientifica in una tecnologia concreta.

Di Donato, qual è la visione che guida oggi GenoGra e il suo percorso personale?

«Il nostro obiettivo di lungo termine è rendere le scienze omiche molto più accessibili e utilizzabili nella pratica quotidiana. Oggi il loro potenziale è ancora sfruttato in modo sottodimensionato. Partiamo dalla genomica, perché è la base fondante di tutta la vita, ma l’idea è ampliare progressivamente il nostro lavoro verso le altre branche omiche, trascrittomica, proteomica, metabolomica, per rendere l’analisi dei dati biologici più semplice, intuitiva e scalabile.

La comprensione attuale del genoma e dei meccanismi biologici è ancora limitata. Approfondirla può abilitare innovazioni in ambito medicale, ma anche ambientale. Lo studio dei genomi degli ecosistemi è fondamentale per politiche di conservazione e protezione. Vogliamo essere pionieri e costruttori di questo futuro».

GenoGra nasce da un team fortemente interdisciplinare. Quanto è stato determinante questo mix di competenze nello sviluppo della vostra tecnologia e nel posizionamento dell’azienda?

«GenoGra è stata fondata da cinque co-founder: quattro ricercatori tra ingegneri biomedici e informatici e un professore del Politecnico di Milano. Successivamente si è aggiunto un late founder con un background più orientato al business e al management. Questo mix di competenze è stato essenziale per trasformare una tecnologia di ricerca in un progetto imprenditoriale. La condivisione della visione è centrale: lavorare in GenoGra significa credere nel potenziale trasformativo della genomica».

Quali limiti dell’approccio basato sul cosiddetto “genoma di riferimento” vi hanno spinto a puntare sulla pangenomica?

«Il genoma di riferimento è una sequenza di DNA considerata come modello standard per una specie. Si prende la sequenza genomica di un individuo e la si confronta con il genoma di riferimento per individuare le varianti genetiche, cioè le differenze rispetto alla sequenza standard. Queste varianti vengono poi interpretate incrociando il genotipo con il fenotipo, cioè con le caratteristiche osservabili dell’individuo. In questo modo è possibile associare alcune mutazioni genetiche a predisposizioni a malattie o a caratteristiche biologiche specifiche, come nel caso delle varianti dei geni BRCA1 e BRCA2, legate al rischio di tumore al seno o alla prostata.

Ma in realtà non esiste un genoma davvero rappresentativo. Anche l’ultimo genoma di riferimento completo deriva dall’integrazione di pochi soggetti: resta una singola sequenza lineare che non può catturare l’enorme variabilità genetica di una specie.

Se il soggetto che analizziamo è molto diverso dal genoma di riferimento, perdiamo accuratezza.

L’idea alla base della pangenomica è che invece di utilizzare un solo genoma di riferimento integriamo tutta la conoscenza già disponibile sulle varianti genetiche in una struttura unica. Non confrontiamo più il genoma di un individuo con una sequenza “media”, ma con una rete di genomi, cioè con un pangenoma che rappresenta la diversità genetica di una popolazione».

Che cosa cambia a livello di analisi?

«L’analisi non consiste più nello studiare le differenze rispetto a un riferimento, ma nel valutare le similarità rispetto ai diversi percorsi possibili all’interno del pangenoma.

Studiare le differenze è un processo complesso e in parte arbitrario, perché dipende da come decidiamo di interpretarle statisticamente. Studiare le similarità, invece, è un concetto più diretto e computazionalmente più efficiente. Questo riduce il numero di passaggi logici necessari e rende l’analisi più robusta, quindi da un lato aumentiamo l’accuratezza, dall’altro riduciamo la complessità per l’utente. Nel modello tradizionale, la complessità è a carico dell’utente, che deve ripetere più volte le analisi per ottenere un risultato affidabile. Qui la complessità si sposta dagli utenti agli algoritmi: i risultati sono più accurati “per costruzione”, con meno passaggi logici e meno iterazioni».

Come funziona la vostra piattaforma e a che punto siete oggi tra sviluppo, validazione e ingresso nel mercato?

«La nostra piattaforma è una piattaforma web: si accede tramite browser e consente di costruire e analizzare pangenomi.
Il cuore della tecnologia è una rappresentazione non lineare del DNA basata su grafi genomici: vere e proprie reti di dati genetici che integrano le varianti di molti individui.

Un aspetto centrale è che la piattaforma valorizza i dati già disponibili. Non chiediamo necessariamente di generare nuovi dati: permettiamo ai clienti di utilizzare il patrimonio di dati genomici che hanno già raccolto per costruire o arricchire pangenomi, anche con informazioni proprietarie.

Una volta costruito il pangenoma, la piattaforma consente due tipi principali di analisi. Da un lato, l’analisi di nuovi campioni: per esempio, confrontiamo il genoma di un individuo con il pangenoma per identificare le sue caratteristiche genetiche, la predisposizione a determinate malattie o, potenzialmente, la risposta a specifici farmaci.
Dall’altro, l’analisi retrospettiva della popolazione rappresentata nel pangenoma, che permette di studiare quante persone presentano una certa variante genetica e quali caratteristiche hanno.

Questo approccio consente non solo di essere più accurati nelle analisi già esistenti, ma anche di scoprire nuove correlazioni e nuovi biomarcatori. Oggi, infatti, per la grande maggioranza delle mutazioni genetiche, oltre il 95%, sappiamo che esistono, ma non conosciamo il loro significato biologico. La piattaforma permette di contribuire a colmare questo gap interpretativo».

Qual è il vero salto tecnologico della vostra piattaforma rispetto alle soluzioni esistenti, e come si traduce in termini di scalabilità, applicazioni e strategia di ingresso nel mercato?

«Gli algoritmi di pangenomica sono molto complessi e, applicati a genomi come quello umano, possono richiedere tempi di calcolo molto lunghi. Noi ci siamo concentrati sull’accelerazione di questi algoritmi, riscrivendoli per sfruttare il parallelismo delle GPU, cioè i processori progettati per elaborare grandi quantità di dati in parallelo, oggi già diffusi nei data center e nei cloud. Invece di eseguire i calcoli uno dopo l’altro, li distribuisce su migliaia di operazioni simultanee.

Questo ci permette di ridurre i tempi di analisi di ordini di grandezza e di rendere la pangenomica una tecnologia realmente applicabile».

Come gestite il tema della sicurezza e della proprietà dei dati?

«I dati rimangono completamente privati. La piattaforma gira nel data center o nel cloud del cliente, senza trasferimento di informazioni a GenoGra. Siamo certificati ISO per la gestione sicura dell’informazione».

Quali sono i prossimi passi, tra applicazioni, certificazioni e finanziamenti?

«Per quanto riguarda la validazione, abbiamo già testato la piattaforma su diversi casi d’uso, microrganismi, piante e dati umani per applicazioni di ricerca. E oggi qui a Londra abbiamo lanciato ufficialmente la nostra piattaforma.
Nella prima fase ci concentreremo sulla genomica non umana e sulle applicazioni di ricerca nella genomica umana. L’utilizzo in ambito diagnostico richiederà invece un percorso di certificazione più lungo e complesso, che affronteremo nei prossimi anni.

Sul fronte finanziario, la strategia prevede nuovi round di investimento privato, affiancati da finanziamenti pubblici ed europei, fondamentali per sostenere la validazione della tecnologia su larga scala e accompagnare l’azienda verso la profittabilità».

Keypoints

  • La startup italiana GenoGra ha lanciato a Londra, durante il Festival of Genomics, una nuova piattaforma di pangenomica.
  • L’azienda è guidata da Guido Walter Di Donato, ceo e co-fondatore, con un background in genomica computazionale e trasferimento tecnologico.
  • La piattaforma affronta uno dei limiti strutturali della genomica tradizionale: l’uso di un unico genoma di riferimento.
  • L’approccio pangenomico integra la variabilità genetica in una rete di genomi, più rappresentativa della diversità biologica.
  • La tecnologia si basa su grafi genomici e algoritmi ottimizzati per GPU, con una significativa riduzione dei tempi di analisi e un aumento della scalabilità.
  • Il sistema consente di valorizzare i dati genomici già disponibili e di costruire pangenomi a partire da dataset esistenti.
  • Le applicazioni riguardano la genomica non umana e la ricerca in genomica umana, con possibili sviluppi futuri nella diagnostica.
  • L’utilizzo clinico richiederà un percorso di validazione e certificazione regolatoria più complesso.
  • La strategia di crescita di GenoGra prevede nuovi round di investimento privato e il supporto di finanziamenti pubblici ed europei.

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Altri articoli

Iscriviti alla nostra newsletter

Rimani aggiornato su tutte le novità