Che i dati in sanità rappresentino una risorsa e un’opportunità con potenzialità straordinarie (in termini di applicazioni e di risultati concreti di salute) è fuori discussione ormai da molti anni. Altrettanto vero, però, è che i dati sanitari portano con sé una serie di complessità intrinseche che ne rendono l’uso più critico e delicato rispetto a molti altri ambiti. Al punto che trovare risposte concrete e ragionevoli a questioni nodali – una su tutte la privacy – è diventata una questione necessaria e imprescindibile per riuscire davvero a trarre utilità e valore dai dati stessi.
Nasce proprio da queste premesse l’evento BIDAP, Big Data and Privacy Health Forum organizzato da Regione Lombardia in collaborazione con INNLIFES e che si terrà a Milano il prossimo giovedì 21 marzo (ci si registra qui): un’intera giornata con oltre venti esperti del settore chiamati a discutere sulle criticità legate alla privacy nell’uso del dato sanitario, sull’importanza del dato secondario e – ovviamente – sulle soluzioni per superare le criticità, come per esempio l’anonimizzazione, e sugli strumenti oggi a disposizione. Per entrare nel merito delle questioni e anticipare alcuni degli spunti rilevanti ne abbiamo parlato con i due responsabili scientifici di BIDAP: Giovanni Corrao, Professore Ordinario di Statistica all’Università di Milano-Bicocca, e Andrea Marcellusi, Research Fellow presso il CEIS-EEHTA, Università di Roma di Tor Vergata e Presidente eletto di Ispor Italy Rome Chapter.
Il punto di vista dei coordinatori scientifici di BIDAP
“Quando si pensa ai dati sanitari in senso lato, si intendono anche tutte quelle informazioni che ciascuno di noi, volontariamente o meno, genera in continuazione ogni volta che ha un contatto con un servizio sanitario, dalla farmacia all’ospedale fino a una visita medica o un esame diagnostico”, spiega Corrao. Tutte queste informazioni sono gestite prevalentemente dalle Regioni e utilizzati per rimborsare chi offre i servizi sulla base delle prestazioni erogate. “Il vero problema in questo contesto”, continua il Professore, “è che i dati sono generati con lo scopo primario di gestire il sistema, dunque non siamo autorizzati a utilizzare quegli stessi dati per scopi che secondo questo punto di vista sono secondari, come per esempio misurare e capire i bisogni di salute dei cittadini o valutare il funzionamento i servizi, ossia tutti gli usi che potrebbero permettere di curare meglio le persone nel prossimo futuro”.
L’attenzione, a questo punto, va anzitutto sulla questione della titolarità del dato e di chi ne sia effettivamente possessore. “I possessori sono i cittadini, ossia chi li produce, mentre i titolari sono le Regioni”, puntualizza Corrao. “Alla domanda se si possano utilizzare questi dati, la risposta da libero cittadino sarebbe ‘sì’, a due condizioni: anzitutto privacy e riservatezza sul mio stato di salute, poi la garanzia che il dato serva a generare conoscenza utile a curare meglio le persone che si ammaleranno dopo di me. Quest’ultimo è un vincolo fortissimo, eppure spesso ignorato, che ci dice che i dati devono essere trattati in modo da produrre nuove conoscenze scientificamente solide”, sottolinea Corrao. Insomma, se a volte si può avere l’impressione che il problema si esaurisca con la fase della raccolta dati, per creare nuova conoscenza la raccolta dati non basta. “Sono temi che in sé non hanno alcunché di nuovo, perché fanno parte della storia della filosofia della ricerca e delle good clinical practice, ma in questo momento le buone pratiche nel produrre evidenza scientifica sembrano quasi ignorate, non si applica il metodo scientifico e talvolta si lavora senza nemmeno sapere che cosa fare con i dati, provocando danni”. Esempio emblematico di questo problema è un famoso studio scientifico che nel 2020 dimostrava l’efficacia dell’idrossiclorochina contro il Covid-19: “Sembrava esserci un’evidenza schiacciante, invece non si era tenuto conto di una fonte di distorsione nella generazione dei dati, e questo ha di fatto indirettamente determinato molti decessi che sarebbero stati evitabili”, commenta. “L’attenzione alla metodologia di ricerca non può mai venire meno”.
“L’idea centrale dell’evento è fare il punto della situazione su un aspetto critico: siamo bloccati nel fare ricerca con i dati dal mondo reale per via dei vincoli di privacy, quando invece usare questi dati permetterebbe di creare valore, di monitorare e di fare programmazione sanitaria sulla base delle risorse disponibili”, aggiunge Marcellusi. In questo caso non si tratta solo di quantificare le risorse necessarie al servizio sanitario, ma anche di vedere l’efficienza con cui le risorse disponibili vengono gestite e porre l’attenzione sull’uso virtuoso delle risorse stesse. “In questi casi siamo molto lontani dal toccare informazioni sensibili sul singolo paziente o a violare la privacy”, evidenzia, “ma di fatto anche questi utilizzi sono impediti perché – per esempio – a qualche livello può esserci un funzionario che appellandosi genericamente alla privacy non concede l’uso del dato”.
E se il dato sanitario di cui si discute oggi è prevalentemente un dato di tipo amministrativo, un’evoluzione importante nello scenario è stata l’entrata in vigore del General Data Protection Regulation (GDPR) nell’Unione Europea. “Se si guardano le pubblicazioni fatte nel corso degli anni”, racconta Marcellusi, “dal 2019 in poi c’è stato un calo quantitativo, ossia sono emerse meno evidenze sui dati amministrativi a livello regionale”. Vale a dire, l’effetto del GDPR è stato di rallentare il processo di generazione di evidenze di questo genere. “Come Ispor Italy Rome Chapter abbiamo notato anche che c’è molta disomogeneità tra le Regioni: è uno scenario a macchia di leopardo, in cui alcune pubblicano tanto (come Toscana ed Emilia-Romagna) e altre molto meno, spesso in funzione della volontà individuale della persona che in ciascuna Regione è deputata al tema. Non dovremmo però dipendere dalle singole persone ma avere una struttura organizzata, e comune a tutti è l’ulteriore problema che molte pubblicazioni restano interne alla Regione stessa”, senza raggiungere la scala nazionale (anche per una questione di interoperabilità). “Questo per quanto riguarda gli studi su dati già disponibili”, chiosa Marcellusi, “per non parlare della scarsità assoluta di studi creati ad hoc per raccogliere dati real world”.
Dall’intelligenza artificiale alla collaborazione pubblico-privato: tutti i temi da discutere
La giornata di lavori di BIDAP si inserisce all’interno di un lavoro più ampio, che ha come obiettivo anche quello di portare i temi al centro della discussione a livello nazionale, “così da mettere a disposizione di Parlamento e Ministero della Salute le competenze tecniche sulla metodologia della ricerca”, chiarisce Corrao. Emblematico in questo senso è la partecipazione all’evento, tra gli altri, del Direttore Generale di Agenas Domenico Mantoan e dell’Assessore al Welfare della Regione Lombardia Guido Bertolaso, oltre che di Simona Loizzo della XII Commissione (Affari sociali) alla Camera dei deputati (nonché presidente dell’Intergruppo parlamentare sulla sanità digitale e le terapie digitali) e di Guido Scorza, componente del Garante per la protezione dei dati personali. “Complessivamente abbiamo messo insieme 9 agenzie nazionali, per affrontare il tema da un duplice punto di vista, sia come garanzia della privacy sia come metodologia della ricerca”, continua ancora Corrao.
La dimensione del dibattito, comunque, è tanto nazionale quanto internazionale. Da un lato c’è la questione della collaborazione tra pubblico e privato, verso un modello che integri le esigenze e le potenzialità di tutti gli stakeholder, partendo da esperienze virtuose regionali per una possibile estensione su scala nazionale. Dall’altro lato, in parallelo, la necessità di non perdere terreno rispetto ad altri paesi europei che – pur sottoposti allo stesso quadro normativo del GDPR – sembrano riuscire a mantenere una maggiore spinta sull’uso dei dati sanitari. “Abbiamo dati sanitari che per numero e qualità sono tra i migliori al mondo, ma non li utilizziamo a dovere per una eccessiva attenzione alla privacy. Siamo seduti sul petrolio ed è un po’ come se non sapessimo di avere questa ricchezza”, puntualizza Corrao. Infine, ma non per importanza, il grande tema dell’intelligenza artificiale: “Il suo ruolo nella sanità oggi è molto limitato”, specifica Marcellusi, “ma in futuro tutto sarà basato sull’intelligenza artificiale. La capacità di raccogliere dati e di usarli sarà decisiva, e l’intelligenza artificiale potrà analizzare le informazioni rapidamente e individuare anche le minime inefficienze”.
BIDAP, Big Data and Privacy Health Forum, si terrà dalle 9:00 alle 18:00 circa di giovedì 21 marzo 2024, in presenza a Milano e in diretta streaming su indicon-innovation.tech. Informazioni e aggiornamenti sul programma sono disponibili sulla pagina ufficiale dell’evento, mentre qui su INNLIFES continueremo ad approfondire il tema nelle prossime settimane.