Ospedale Gaslini di Genova: big data contro le malattie rare e a supporto della medicina di precisione
Dopo anni di lavoro e ingenti investimenti il Gaslini di Genova è pronto a costruire database strutturati in grado di integrare tutti i dati relativi ai suoi 40mila pazienti. Si stanno affr

Ospedale Gaslini di Genova: big data contro le malattie rare e a supporto della medicina di precisione

Federico Zara, Dipartimento Testa-Collo e Neuroscienze - Dipartimento Funzionale Neuroscienze e Riabilitazione Responsabile U.O.S.D. Laboratorio di Neurogenetica e Neuroscienze: “Il progetto

L’ente
L'istituto Gaslini è il più grande ospedale pediatrico del nord Italia, con i suoi 22 edifici disposti su oltre 73.000 metri quadri di litorale, due terzi dei quali destinati a parco.
Al Gaslini lavorano oltre 2.000 persone tra medici, infermieri, universitari e ricercatori. Ci sono tutte le specialità pediatriche, numerosi laboratori e cattedre universitarie convenzionate, molte delle quali con relative scuole di specializzazione. Dalla sua fondazione il Gaslini è, infatti, sede dell’Università di Genova: presso l’ospedale i medici si specializzano in Pediatria, Chirurgia Pediatrica, Psicologia clinica e Neuropsichiatria infantile. Inoltre la storica formazione del personale infermieristico ha dato vita da alcuni anni al Corso di laurea per infermiere pediatrico.
Mediamente sono 500 i posti letto complessivi, circa 50 mila i ricoveri all’anno (tra ordinari, day hospital e ambulatoriali), con più di 40 mila accessi al Pronto Soccorso di 2° livello. Circa il 45% dei bambini proviene da altre Regioni – nord compreso - e dall'estero, e in alcuni reparti d’eccellenza la percentuale di ricoveri da fuori Regione supera l’80 %.
Sono circa 600 l’anno i pazienti di nazionalità straniera, provenienti mediamente da sessanta paesi del mondo.

L’idea in breve
L’obiettivo del progetto bio-informatico del Gaslini è integrare le piattaforme che sono già presenti e correlarle ai dati clinici dei pazienti per lo sviluppo di terapie personalizzate, applicandole in particolare alle malattie rare, quelle malattie che non hanno cure disponibili.
Il creare nuove correlazioni serve, ovviamente, a trovare nuove soluzioni. Una pratica che finora si è portata avanti a livello di singolo paziente/medico senza che fosse sistematizzato.

Il contesto

La medicina personalizzata, o di precisione, è un approccio emergente di trattamento e prevenzione delle malattie che tiene conto della variabilità individuale di geni, ambiente e stili di vita di ciascuna persona. Centrali alla medicina di precisione sono le diverse discipline di Laboratorio, poiché a condurre l’approccio terapeutico è soprattutto la diagnostica (Precision Diagnostics) che richiede “qualità” metodologica e una comprensione corretta del rapporto tra innovazione ed “evidenze”.
La diffusione e il miglioramento delle tecnologie di caratterizzazione molecolare a cui abbiamo assistito in questi ultimi anni permette di studiare contemporaneamente diversi livelli di informazione biologica. Tali livelli implicano lo studio del DNA, sia nell’uomo (genomica) sia nelle comunità batteriche che popolano i suoi organi e tessuti (metagenomica), la valutazione qualitativa e quantitativa dei livelli di RNA (trascrittomica), e di proteine (proteomica) in specifici tessuti, e l’analisi delle impronte chimiche lasciate da specifici processi fisiologici (metabolomica); questi ambiti di studio vengono definite nel loro insieme discipline “omiche”.

L’esigenza
La necessità di analizzare l’enorme quantità di dati generata da queste tecnologie ha dato un forte impulso alla creazione di nuovi strumenti e metodi bio-informatici. Attualmente la ricerca in questo campo è particolarmente indirizzata allo sviluppo di metodologie che permettano l’integrazione dei dati di diverse scienze omiche, in modo da eseguire una caratterizzazione molecolare più completa del fenomeno biologico in condizioni fisiologiche e patologiche.
Lo sviluppo di procedure computazionali che prendano in considerazione i diversi livelli e siano in grado di integrarli, ha permesso di mettere in evidenza meccanismi non osservabili quando i livelli biologici sono analizzati in maniera indipendente. Uno dei principali limiti a questo sviluppo è il fatto che i dati provenienti dai diversi livelli biologici sono eterogenei e hanno differenti scale e unità di misura, con la conseguenza che una comparazione diretta risulta estremamente complicata.
L’utilizzo di queste metodologie consente di caratterizzare il profilo molecolare individuale e di riclassificare i pazienti sulla base del coinvolgimento di specifici meccanismi patologici o dell’espressione di determinati biomarcatori, al di là delle macroscopiche e, spesso non specifiche, manifestazioni cliniche, al fine di pianificare terapie personalizzate.
Uno dei settori di applicazione che maggiormente beneficerebbe di approcci clinici e biologici integrati sono le malattie genetiche rare del bambino, in quanto complesse ed eterogenee nell’espressività fenotipica e non curabili attraverso gli strumenti terapeutici disponibili.

Sviluppo del progetto
Il progetto si configura come una linea strategica dell’Istituto perseguita nell’ultimo quinquennio con l’acquisizione di piattaforme tecnologiche di ultima generazione (Sequenziatori NGS e Spettrometri di Massa) per la Genomica, nelle sue varie declinazioni, la Proteomica e la Metabolomica, inserite nell’ambito di Core Facilities e di strumenti informatici di estrazione e rielaborazione dei dati. In parallelo nell’ottica della medicina personalizzata è stata sviluppata una piattaforma avanzata di High Content Imaging per lo screening di composti farmacologici mediante saggi cellulari e lo sviluppo iniziale di terapie innovative. È stato già aperto un Centro Trial per il coordinamento dei trial farmacologici in avanzata fase di sperimentazione su pazienti. Infine è stata completata la transizione dei dati clinici cartacei in dati clinici elettronici (Electronic Health Records) con l’implementazione della ‘cartella elettronica Galileo’ grazie alla quale è possibile registrare ed estrarre dati clinici e strumentali raccolti nel corso degli accessi in Istituto.
Il completamento infrastrutturale del progetto è determinato dalla creazione di un “Core Bioinformatico” che sarà effettuata nel corso del 2019. Il Core bio-informatico sarà costituito da una piattaforma informatica basata su applicativi open source chiamata i2b2 (Informatics for Integrating Biology and the Bedside).
La piattaforma è stata concepita e sviluppata presso il National Institute of Health (NIH) e utilizzata da diversi numerose istituzioni nel mondo, soprattutto in ambito Pediatrico.

I tre progetti pilota
Le potenzialità della piattaforma i2b2 verranno testate attraverso tre progetti pilota nell’ambito delle epilessie, delle immunodeficienze congenite e delle nefropatie, per la quale sono già disponibili ampie casistiche altamente caratterizzate sul piano clinico e sperimentale.  
Attraverso i2B2 saranno effettuate analisi per l’identificazione di specifiche sottopopolazioni di pazienti sulla base di molteplici dati clinici e molecolari provenienti dall’attività diagnostica e dalle piattaforme tecnologiche delle Core Facilities. La stratificazione a elevata risoluzione infatti rappresenta il passo fondamentale sulla quale è possibile testare terapie sperimentali personalizzate attraverso il Trial Center e avviare programmi di sviluppo farmacologico mediante la piattaforma di High Content Imaging.

Benefici
I beneficiari del progetto sono in primo luogo i bambini affetti da patologie rare per le quali non sono oggi disponibili terapie risolutive e mirate a intervenire su specifici meccanismi patologici. Il progetto tuttavia rappresenta nel lungo termine una preziosa risorsa per tutti i pazienti che verranno assistiti al Gaslini, quando l’integrazione dei dati mediante i2B2 e le procedure analitiche saranno pienamente operative e applicate in modo sistematico.
I partner
IIT e Università di Genova sono partner preziosi per lo sviluppo del progetto. È stata esplorata anche la disponibilità del partner tecnico IBM. L’aspetto rilevante di questo progetto è che sarà sviluppato internamente all’Ospedale da figure dedicate, nel corso del 2019.
Inoltre il Gaslini fa parte della rete pediatrica e di altre iniziative nazionali e internazionali. In questa prima fase non sarà possibile utilizzare i dati comuni della rete nazionale/internazionale per problemi amministrativi e legislativi. Per mettere insieme i dati, infatti, è importante che questi siano omogenei, cosa che però prevedrebbe un’opera di coordinamento enorme. Si tenga presente che all’interno della sola regione Liguria tutti gli ospedali hanno cartelle mediche strutturate in maniera diversa, archiviando così dati non omogenei e non incrociabili tra loro.
Il primo ostacolo da superare è quello di armonizzare i dati internamente e strutturare una repository corretta all’interno dell’ospedale stesso. Solo a quel punto sarà possibile iniziare a comunicare all’esterno, ma come prima cosa bisogna coordinarsi internamente e quindi rendere omogenei i diversi dati clinici interni. Dopodiché sarebbe un ottimo traguardo riuscire a coordinare i più importanti istituti pediatrici italiani.

Evento collegato: