Spiegazioni concernenti i Big Data

Big Data apre nuove opportunità per l'acquisizione di conoscenze sociali o scientifiche, offrendo nel contempo alle aziende commerciali una diversa forma di creazione di valore aggiunto. Big Data può però anche rappresentare una minaccia per la sfera privata, soprattutto se i dati trattati non sono stati adeguatamente anonimizzati. Nel caso di dati riferiti a persone è necessario che sia tutelato il diritto alla sfera privata e che sia garantita la protezione dei dati personali.

Introduzione

Già prima dellerecenti rivelazioni sulle enormi quantità di dati raccolti, registrati e analizzati da diversi servizi segreti, l'attenzione dell'opinione pubblica è stata attratta  dal fenomeno dei Big Data. L'utilizzo quotidiano dei servizi di telecomunicazione e della rete, l'impiego degli apparecchi elettronici, delle carte di credito e di debito, gli acquisti, il consumo di corrente ecc. sono tutte attività che generano ingenti quantità di dati. Ad essi si aggiungono quei dati che le autorità pubblicano in virtù del loro mandato legale o nell'ambito di progetti open data. Le informazioni raccolte vengono valutate da attori diversi e utilizzate (anche) a scopi commerciali. Dal punto di vista economico i Big Data rappresentano un enorme potenziale. Si prevede che entro il 2020 la quantità di dati digitali prodotti a livello mondiale aumenterà di almeno quaranta volte.

Cosa sono i Big Data?

L'espressione «Big Data» indica una quantità ingente di dati provenienti da fonti diverse che, dopo esser stati raccolti a una velocità di elaborazione elevata, vengono registrati e resi accessibili alle valutazioni e alle analisi per scopi  non definiti e per un periodo indeterminato. L'intensità delle procedure di elaborazione è determinata dallo sviluppo tecnologico, che ha fortemente ridotto i costi e i tempi necessari all'immagazzinamento e alla valutazione di enormi quantità di dati. In tal modo, i dati possono essere facilmente custoditi nel tempo e venire riutilizzati in futuro per gli scopi desiderati. I metodi e le tecnologie sviluppati di recente permettono l'analisi e l'integrazione di ingenti quantità di dati. A queste grandi banche dati vengono applicati degli algoritmi, nell'intento di individuare nuovi profili e rilevare analogie, connessioni o discrepanze.

Il sistema dei Big Data è caratterizzato da quattro aspetti principali che, in base alle iniziali dei loro nomi in inglese, vengono designati come «le quattro V»:

I Big Data sono grandi raccolte di dati (Volume) che vengono elaborati a velocità molto elevata (Velocity). Una terza caratteristica è data dall'eterogeneità e dalla varietà di questi dati (Variety). I Big Data offrono nuove possibilità di combinare dati provenienti da fonti diverse, che fino ad ora era impossibile mettere in relazione fra loro. Ad esempio, è possibile connettere fra loro i dati di un elenco interno di clienti con dati esterni provenienti dalle reti sociali, dai motori di ricerca, dai bollettini ufficiali o dalle banche dati dei portali open data gestiti dalle autorità. La quarta caratteristica è costituita dal valore aggiunto (Value) che l'analisi dei dati permette di conseguire. 

Opportunità e rischi legati ai Big Data

Il sistema dei Big Data viene considerato anche una sorta di miniera d'oro, in quanto apre nuove opportunità per l'acquisizione di conoscenze sociali o scientifiche, offrendo nel contempo alle aziende commerciali una diversa forma di creazione di valore aggiunto, determinata dall'integrazione e dalla valutazione di informazioni eterogenee e destrutturate. Tra i casi di applicazione più comuni si possono ad esempio menzionare le ricerche di mercato, condotte in modo rapido e automatizzato e in grado di reagire prontamente a ogni cambiamento; l'individuazione di casi di abuso nelle transazioni finanziarie; lo svolgimento in rete di analisi dettagliate per l'incremento e l'ottimizzazione del marketing online; lo svolgimento di diagnosi mediche complete oppure l'esecuzione di indagini incrociate o l'allestimento di profili per i servizi segreti o la polizia. 

Big Data può però anche rappresentare una grave minaccia per la sfera privata, segnatamente nei casi in cui le informazioni riguardanti una singola persona e i vari ambiti della sua vita vengono raccolti e vagliati in modo sistematico e strutturato. Potrebbe quindi succedere, ad esempio, che un'assicurazione neghi le proprie prestazioni a una persona, poiché dall'analisi dei dati relativi alla sua salute risulta un'elevata predisposizione a contrarre una malattia. Oppure vi potrebbero essere dei servizi d'informazione che, nell'intento di prevedere presunti rischi in materia di politica di sicurezza, decidono di adoperare algoritmi per Big Data, esercitando per il tramite di diversi canali una sorveglianza permanente sulle persone private.

Big Data: un problema di protezione dei dati?

Le leggi sulla protezione dei dati disciplinano il trattamento dei dati personali. Sono considerati dati personali tutte le informazioni relative a una persona identificata o identificabile (art. 3 lett. a LPD). Nel caso dei Big Data si tende a sostenere che, nella maggioranza dei casi, i dati raccolti sono semplici dati tecnici o dati anonimizzati, e che per questa ragione le disposizioni sulla protezione dei dati non possono essere applicate.

Nel caso di Big Data costituiti da dati «tecnici» o «anonimizzati», il problema è dato dal fatto che, al momento della fusione di diverse banche dati, non si può escludere che tali dati vengano deanonimizzati. In molti casi, infatti, l'anonimizzazione di singoli identificatori univoci non è sufficiente per escludere le reidentificazioni. Particolare attenzione va prestata anche nell'utilizzo dei cosiddetti quasi-identificatori, ossia le combinazioni di attributi come la data di nascita, il sesso e il codice di avviamento postale. A tal proposito, alcuni studiosi statunitensi hanno calcolato che l'80 per cento della popolazione americana può essere identificato a posteriori sulla sola base di queste tre caratteristiche. Più difficile risulta ovviamente effettuare un'attribuzione a posteriori se i quasi-identificatori vengono elaborati in forma più generica, ossia se al posto di precisare l'età di una persona (p. es. 44 anni) si sceglie di indicare che essa è compresa «fra i 40 e 49 anni». Quando vengono creati più campi dati generici si parla di «k-anonimato» (k-anonymity). Quanto più elevato è il valore numerico di «k», tanto più numerosi sono i dati che presentano la stessa combinazione di attributi, ciò che ne rafforza il carattere anonimo. Qualora si decida invece di anonimizzare i dati personali in una forma meno restrittiva, occorre considerare che il loro trattamento continua a sottostare ai requisiti legali in materia di protezione dei dati e che il detentore originario dei dati può essere chiamato in causa.

Un altro problema è costituito dal prevedibile sviluppo tecnologico: è possibile, infatti, che - grazie appunto alla rapida evoluzione della tecnologia e a nuove fonti da cui provengono i dati - ciò che oggi viene considerato «anonimo» venga in un domani attribuito senza troppe difficoltà a una determinata persona, ciò che potrebbe configurare un caso di grave lesione della personalità. È pertanto necessario che le questioni riguardanti la protezione dei dati vengano affrontate sin dall'avvento di nuove tecnologie. Sarebbe quindi opportuno che i criteri in materia di protezione dei dati siano integrati sin dalla fase iniziale di un progetto («Privacy by Design»), evitando in tal modo l'insorgere di problemi successivi che potrebbero essere risolti solo con un grande dispendio di tempo e di denaro.

Qui di seguito vengono illustrati alcuni importanti aspetti relativi alla protezione dei dati nell'utilizzazione di Big Data:

  • le opportunità offerte dalla tecnologia costituiscono una sfida alle necessità di trasparenza in materia di protezione dei dati: ogni persona ha il diritto di sapere, a proposito di dati che la concernono, quali sono questi dati, chi li sta trattando e per quale scopo vengono trattati. Nel caso dei Big Data, è estremamente difficile per le persone interessate capire come vengono trattati i dati e in che modo sono integrati fra loro dati provenienti da fonti diverse. Per questa ragione, chi fa capo ai Big Data è tenuto a dar prova di particolare trasparenza e a informare le persone interessate.

  • Big Data costituiti da dati personali devono ottenere l'autorizzazione delle persone interessate. In tal senso, è necessario che queste ultime conoscano in modo chiaro e inequivocabile lo scopo delle procedure applicate, e questo sin dalla fase di acquisizione dei dati. Questa esigenza contrasta tuttavia con il principio stesso dei Big Data, dove i dati vengono raccolti preventivamente per essere utilizzati in futuro per gli scopi desiderati. Tuttavia, una descrizione troppo vaga e generica dello scopo fornita nel contesto delle informazioni che riguardano l'elaborazione dei dati fa sì che l'autorizzazione non abbia alcun valore giuridico.

  • Un'ulteriore difficoltà è data dall'esigenza di disporre di dati esatti: gli algoritmi che vengono applicati nei Big Data permettono di analizzare in modo autonomo e automatizzato banche dati di grandi dimensioni, anche nelle loro connessioni reciproche. Queste procedure di analisi generano nuove informazioni riferite a dati personali, a proposito dei quali non è possibile dire se siano veri o falsi; si tratta piuttosto di contenuti verosimili, passibili di interpretazione.

Conclusioni

Big Data apre nuove opportunità per l'acquisizione di conoscenze sociali o scientifiche, offrendo nel contempo alle aziende commerciali una diversa forma di creazione di valore aggiunto. Big Data può però anche rappresentare una minaccia per la sfera privata, soprattutto se i dati trattati non sono stati adeguatamente anonimizzati. Nel caso di dati riferiti a persone è necessario che sia tutelato il diritto alla sfera privata e che sia garantita la protezione dei dati personali. Nel configurare le tecniche e le procedure relative ai Big Data occorre dunque fare in modo che esse soddisfino le esigenze in materia di protezione dei dati. È necessario quindi che i relativi criteri vengano considerati sin dalla fase iniziale di un progetto e che la sicurezza dei dati sia garantita. In questo settore è inoltre essenziale che le esigenze di trasparenza e di procedura siano elevate. Il rapporto fra i Big Data costituiti da dati personali e i principi su cui poggia la legge sulla protezione dei dati risulta assai problematico, in particolare per quanto attiene la destinazione vincolata e l'economia dei dati. Risulta pertanto evidente che le attuali concezioni in materia di protezione dei dati si trovano di fronte a grandi sfide. I Big Data sono ormai una realtà e il loro utilizzo mette in questione le disposizioni fondamentali contenute nella legge federale sulla protezione dei dati (LPD). Occorrerà pertanto sottoporre la LPD a una verifica di fondo che consideri come sia possibile, nell'utilizzazione dei Big Data, preservare i principi centrali della destinazione vincolata, dell'autorizzazione e della trasparenza.

https://www.edoeb.admin.ch/content/edoeb/it/home/datenschutz/Internet_und_Computer/onlinedienste/erlaeuterungen-zu-big-data/erlaeuterung-zu-big-data.html