lunedì 24 aprile 2017

Non è elementare Watson!

"Non è elementare Watson".   Non essendo Sherlok Holmes, partirei da questo dato di fatto.  Watson non è affatto uno strumento banale e varrebbe la pena tenerlo presente quando si commentano situazioni relative a questa iniziativa. 

A questo ho pensato leggendo la notizia riferita da MilanoToday che informa di una interrogazione presentata da un consigliere regionale della Lombardia per sapere se sia vero che la Regione vende i dati sanitari dei lombardi a Ibm

Si tratta, infatti, di un sistema di intelligenza artificiale, in grado di rispondere a domande espresse in un linguaggio naturale. Per dare un'idea delle dimensioni di questo progetto è utile considerare che Watson può analizzare 500GB, equivalenti ad un milione di libri, ogni secondo. I costi dell'hardware di Watson  sono stati stimati in tre milioni di dollari.  Stiamo parlando di un progetto di eccellenza che IBM gestisce da più di vent'anni (e - tra l'altro - il nome è stato scelto in onore del primo presidente dell'IBM Thomas J. Watson)  il  suo obiettivo è quello di avere computer in grado di interagire nel linguaggio naturale con gli uomini attraverso una vasta gamma di applicazioni e processi, capendo le domande poste dagli esseri umani e fornendo risposte in un linguaggio comprensibile da essi.

Detto questo le applicazioni di uno strumento così potente ai vari settori delle attività umane sono potenzialmente infinite ma è nella ricerca farmaceutica e nelle scelte di politica sanitaria che si potranno avere risultati che incideranno profondamente nella determinazione della speranza di vita del genere umano nei prossimi decenni.   Come è facile immaginare,  in ambito sanitario Watson sarà utilizzato come sistema di supporto per le decisioni cliniche, ad utilizzo del personale medico. Per aiutare i medici nel trattamento dei loro pazienti, non appena un dottore ha posto una domanda al sistema specificando i sintomi e gli altri fattori correlati, Watson prima elabora l'informazione per identificare le parti più importanti, poi elabora i dati del paziente per trovare fatti rilevanti nella storia medica ed ereditaria del paziente, in seguito esamina i dati disponibili dalle fonti per formulare e testare ipotesi, e infine fornisce una lista di raccomandazioni individualizzate e classificate per livello di evidenza. Le sorgenti di dati che Watson utilizza per le analisi possono includere linee guida di trattamenti, registri medici elettronici, annotazioni dei dottori e degli infermieri, materiali di ricerca, studi clinici, articoli di riviste e informazioni sul paziente.

IBM prevede di investire fino a 150 milioni di dollari nel corso dei prossimi anni e di riunire data scientist, ingegneri, ricercatori e progettisti di Watson per sviluppare una nuova generazione di applicazioni e soluzioni sanitarie basate sui dati.

Queste cose possono piacere o meno ma sono, inevitabilmente, le conseguenze della nuova capacità di software ed hardware di elaborare enormi masse di dati.  la novità principale consiste nel fatto che dai dati non si estraggono più le stesse informazioni presenti nel data base consultato  ma informazioni nuove generate dall'elaborazione di quelle di cui si dispone.

Se vogliamo usare un'immagine suggestiva non si tratta più solo di cercare un ago in un pagliaio ma di generare  l'ago e di usarlo nel modo corretto e al momento giusto.  Questo significa, in definitiva, usare i Big Data.

Ridurre tutto questo ad una mera vendita di dati mi sembra francmente riduttivo. Siamo di fronte ad una nuova frontiera della conoscenza che come tutte le cose cui non siamo abituati può suscitare perplessità e reazioni epidermiche.  I rischi sono numerosi ma non riguardano, direi, il mercimonio di dati sanitari che sono già oggi protetti da norme molto rigorose che ne impediscono utilizzi impropri.

Sarà necessario fornire un'adeguata informativa agli interessati e presumibilmente il titolare del trattamento nominerà IBM responsabile fornendo istruzioni accurate per garanttire la pseudonimizzazione e anonomizzazione dei dati a seconda delle modalità e finalità di utilizzo dei dati stessi.

Non credo quindi sia sufficiente chiedere conto di questa ipotizzata vendita di dati. Non è quello il problema reale, perchè le norme già oggi disciplinano questi aspetti e rendono legittimo questo passaggio di informazioni, rispettando alcuni criteri di gestione.

La vera questione, a mio parere, è legata al fatto che l'intelligenza di Watson potrà essere usata per determinare il destino di una persona e a condurre, spietatamente, un'analisi dei costi/benefici rispetto all'opportunità di spendere denaro, tempo e competenze per curare una persona destinata (con la logica probabilistica che Watson utilizzerà ampiamente) a non guarire o a morire per un' altra patologia (magari latente nel momento in cui viene formulata la valutazione).

Intendo dire che il vero quesito non riguarda tanto il fatto di stabilire se i dati sanitari dei cittadini lombardi siano stati "venduti" ad IBM. Basta un bravo data protection specialist per permettere di gestire questo flusso di dati nel pieno rispetto della normativa: una buona informativa, una nomina a responsabile del trattamento, un privacy program che permetta di definire tempi, modi e fini di utilizzo dei dati  modulando bene anonimizzazione e pseudonimizzazione dei dati.

Ma le criticità vere, presenti in questa situazione sono molto più concrete e sostanziali:  si tratta di definire le finalità per le quali è lecito che i dati sanitari siano affidati ad un gestore di intelligenza artificiale e quali siano i limiti di utilizzo delle informazioni raccolte in questo modo. 

Capisco che si possa essere allarmati da questo passaggio di dati sanitari dal Pubblico al Privato ma ritengo che il vero problema sia quello di fare in modo  che l'intelligenza artificiale che esaminerà  queste informazioni sensibili non sia solo un'intelligenza aumentata rispetto a quella umana ma sia anche,  come insegna la psicologia più consapevole, attenta alle conseguenze delle singole azioni.  La vera intelligenza è quella emotiva che è in grado di riconoscere, utilizzare, comprendere e gestire in modo consapevole ciò che è bene per sè e per gli altri. Di questo dovremo occuparci nel prossimo futuro:  saper usare i dati in modo intelligente e rispettando ogni persona.
 
Questa è la vera frontiera che la tecnologia ci chiederà di superare.

Sarebbe bello che la classe politica parlasse di questo.