Abusare del deep learning e three learning con real time prediction per falsare i risultati

Source: Deep Learning on Medium

Abusare del deep learning e three learning con real time prediction per falsare i risultati

Photo by geralt from pixabay.com

Deep learning (medie di risultati) e three learning (alberi decisionali) sono diventati fondamentali per l’implementazione di algoritmi sempre più stupefacenti e predittivi. Sia il deep learning che il machine learning sono applicabili in contesti diversi e in modalità diverse. I metodi di apprendimento eccetto per qualche eccezione (complessa con apprendimenti miscelati interattivo/non interattivo) sono due:

  • Apprendimento non interattivo (senza disturbo di agenti esterni “es. uomo”): vengono preparati un set di dati (dataset) catalogati (dall’uomo) e successivamente ne viene “applicato” l’algoritmo.
  • Apprendimento interattivo: in questo caso l’algoritmo “apprende” in tempo reale grazie all’interazione con l’uomo o con agenti esterni (sensori, webcam, uomo…)

Rompiamo neuroni e alberi decisionali

Quello che sto per raccontarvi è semplificato all’estremo quì non parleremo di layer neurali ne come funzionano (quí si https://www.tensorflow.org/learn) ma semplicemente supporremo di risolvere un problema banale con deep learning e lo “romperemo”

Vogliamo che la nostra rete neurale impari a fare la somma di due numeri tramite l’interazione con l’uomo.

Ad un gruppo di uomini verrà chiesto di continuo di fare la somma tra due numeri: sia i numeri che il risultato della somma vengono dati in pasto alla nostra rete neurale. Ovviamente il risultato che otterremo è una media del risultato corretto: significa che più somme diamo in pasto alla nostra rete neurale più questa sarà in grado di fare la somma tra due numeri. E quindi ?

Quindi nel caso in cui tra il gruppo di uomini alcuni decidessero di rispondere di proposito in maniera errata alle domande “avvelenerebbe” la nostra rete neurale di risultati errati con la conseguenza di far rallentare il tempo di apprendimento (anche di molto). L’esempio che abbiamo appena fatto è banale e scontato. Lo scenario diventerebbe più disastroso nel caso in cui cercassimo di “falsare” i dati per l’apprendimento in tempo reale di una stazione meteo, un sensore e chi più ne ha più ne metta.

Lo scenario che abbiamo previsto per il deep learning è ripetibile con un albero decisionale (spesso utilizzato in chat bot). Supponiamo di avere un albero decisionale per “scoprire” se in generale le persone quando c’è bel tempo sono felici o tristi.

Nel caso specifico l’80% del campione di utenti ha deciso che è felice quando c’è bel tempo.

Anche in questo caso il sentimento di felicità manifestato potrebbe essere stato falsato da una serie di risposte consapevolmente errate.

Questo tipo di problematica spesso viene sottovalutato e vanifica la bontà delle nostre predizioni.

Vincenzo