I dati sintetici verso nuove frontiere

Original article was published on Artificial Intelligence on Medium

pxfuel

I dati sintetici verso nuove frontiere

Dato-Informazione

In un’epoca tutta votata all’immagazzinamento dei dati e alla loro elaborazione in termini di business, scopriamo “voci” nuove. Se il dato è una rappresentazione oggettiva di una realtà, non interpretata, l’informazione rappresenta invece proprio la realtà elaborata e derivante dall’interpretazione aggregata di dati! Se proseguiamo sullo stesso cammino, dal dato e dalla sua elaborazione, l’informazione, passiamo alla conoscenza. Cioè dai dati elementari, si passa ad una loro aggregazione ed elaborazione che li trasforma in cosiddetti dati sintetici, che trasformeranno quel dato in informazione!

Cosa sono dunque i dati sintetici? Sono quei dati artificiali che conservano le stesse caratteristiche statistiche dei dati reali, ma che sono definiti “artificiali” in quanto elaborati con metodologie di sintesi, che li rendono più utilizzabili con minor aggravio di costi di conservazione e mantenimento, ma anche meno “precisi”, in quanto rispondenti alle esigenze e alle scelte soggettive di chi effettua la sintesi. Tale processo, a seconda che, ab initio, soddisfi una richiesta specifica, o, invece, la indirizzi, si definirà pull o push.

Compliance

Quello che oggi attira molto l’attenzione è il potenziale utilizzo compliant con la privacy, dei dati sintetici, semplice viatico, sebbene anonimo, di dati reali, che vengono elaborati da sistemi di intelligenza artificiale e di apprendimento automatico, che duplicano le relazioni e le tendenze dei dati reali, ma non hanno alcun richiamo ad essi e pertanto non sono riconducibili ad individui reali.

Questo rappresenta, in linea generale, un nuovo traguardo, sebbene non sempre l’utilizzo di dati sintetici sia effettivamente in grado di garantire una totale anonimizzazione: è un processo che va costruito a monte, con attenzione e cautela, evitando che le relazioni e le dinamiche per trasferire i dati reali in sintetici, non creino anomalie e non rendano, pertanto, inevitabile, la riconducibilità, di quelle stesse anomalie, a individui identificabili.

Conclusioni

Siamo, a conti fatti, nell’era delle informazioni, dei dati o rimane vera la frase dell’astronomo Clifford Stoll «I dati non sono informazioni, le informazioni non sono conoscenza, la conoscenza non è comprensione, la comprensione non è saggezza»?

Riproduzione Riservata

Avv. Raffaella Aghemo