Investigazioni digitali

Indagini sull'identità digitale di una persona

Secondo il più recente report di GlobalWebIndex, gli italiani trascorono in media 1 ora e 46 minuti sui social ogni giorno.

Inoltre si stima che ad ogni persona siano associati oltre 8 profili di identà digitali. 

Indagini sull'identità digitale di una persona


Molto spesso, tuttavia, le persone hanno anche un limitato grado di controllo sulla rappresentazione pubblica della prorpia "identità digitale" che spesso viene imposta automaticamente.

Nondimeno, su molte delle piattaforme digilitali e dei motori di ricerca, l'impostazione delle identità "digitalizzate" degli utenti, avviene mediante "profili" creati automaticamente sulle basi di dati (alcuni forniti dallo stesso individuo, mentre altri "costruiti" da algoritmi), la cui proprietà è riconducibile a società pubbliche o private, che, pertanto, sfuggono da possibilità di supervisione o controllo per mano del singolo individuo.


Lo sviluppo del web 2.0, nonchè della successiva pervasività delle sue applicazioni, oggi, hanno prodotto la nascita di una rappresentazione digitale (identità digitale o persona digitale), degli individui che usano la rete, da qualsivoglia punto di accesso o luogo di provenienza. 

(Per Web 2.0 si intende la fase del Web, successiva al Web 1.0, caratterizzata dalla possibilità degli utenti di interagire e modificare i contenuti delle pagine web di un sito, portale o piattaforma web).

Tale rappresentazione, infatti, si discosta largamente da quella tradizionalmente basata sull'apparenza dell'individuo e dei suoi comportamenti pubblici che da sempre ne hanno definito "l'identità personale".

Uno dei primi studiosi ad occuparsi della nascita di tali personalità e identità digitali (digital persona), nonchè dei suoi effetti sulla privacy dei cittadini, fu, già a partire dal 1994, il tecnologo Roger Clarke che diede la seguente definizione:

"La persona digitale è un modello di personalità individuale pubblica basato su dati e mantenuto da transazioni, destinato ad essere utilizzato su delega dell'individuo".

Sappiamo tuttavia che, oggi, tale funzione di "delega" virtualizzata, viene negata nei fatti e nella sostanza, sia alle differenti società che gestiscono in maniera quasi monopolistica gli svariati servizi offerti dalla rete (tra cui, Google, Microsoft, Apple, Facebook, Twitter, Instagram, Linkedin, etc.), sia dalle agenzie di intelligence governative e privatizzate, tutte, così come portato ad evidenza dallo scandalo planetario del 2013.

Nello stesso anno infatti, è stata portata in evideza la vicenda direttamente connessa ad Edward Snowden e la NSA statunitense, con le forti rivelazioni sul definito "Datagate", dei vari sistemi, americani, "Prism" e "Muscular", o inglesi, "Tempora" di CGHQ (Government Communications Headquarters), nonchè al coinvolgimento dei vari stati, Francia, Germania, Spagna, Svezia, etc., con il quale le organizzazioni di intelligence avevano rapporti. 

Nel mercato "proprio" del web, ogni gestore o "provider", o fornitore di servizi, infatti, può acquisire od "acquistare" massivamente e legalemente dati personali degli utenti, come ad esempio i contratti di accesso ai servizi cui accediamo ogni giorno che lo permettono, o illegalmente, di fatto le agenzie di intelligence come la NSA americana, etc., possono decidere autonomamente, in questo caso di acquisire o "requisire", i dati di qualsiasi individuo sospettato, con presumibile, ipotetica o ragionevole certezza, di atti terroristici, etc., lasciando, per un certo punto di visto, illimitate possibilità di utilizzo, nonchè di profilo di interessamento. 

Questa esorbitante massa di dati, inferenzialmente connessi per mezzo di specifici algoritmi (programmi macchina), "costruiscono", per larga parte, la personalità digitale astrattamente "adattabile" al singolo individuo, addirittura prevedendone i comportamenti futuri, come d'altronde dichiarato dalle sperimentazioni e dagli studi di prestigiose università tra cui Harvard, Yale, Cambridge, etc. e dallo scandalo Facebook-Cambridge Analytica.

(Lo scandalo dei dati Facebook-Cambridge Analytica, è stato uno dei maggiori scandali politici avvenuti all'inizio del 2018, quando fu rivelato che Cambridge Analytica aveva raccolto i dati personali di milioni di account Facebook senza il loro consenso e li aveva usati per scopi di propaganda politica.

È stato definito come un momento di spartiacque nella comprensione pubblica dei dati personali e ha provocato un forte calo del prezzo delle azioni di Facebook, alla quale si chiede una regolamentazione più rigorosa sull'uso dei dati personali da parte delle aziende tecnologiche.

Tre organizzazioni giornalistiche infatti, pubblicarono i loro articoli in contemporanea il 17 marzo 2018, causando grande clamore e sconvolgendo l'opinione pubblica. Oltre 100 miliardi di dollari sono stati eliminati dalla capitalizzazione di Facebook, e in pochi giorni i politici americani e inglesi hanno chiesto spiegazioni al CEO di Facebook Mark Zuckerberg. Lo scandalo, alla fine, lo ha portato ad accettare di testimoniare davanti al Congresso degli Stati Uniti.

L'evento fu significativo in quanto accese i riflettori sugli standard etici dei social media, delle organizzazioni per la consulenza politica, e degli stessi politici. I sostenitori dei consumatori hanno chiesto una maggiore protezione degli utenti online e in materia di diritto alla privacy, oltre a limitare la disinformazione e la propaganda, nonchè, eventualmente, condizionare il comportamento della massa degli elettori).

I dati acquisibili e sottoposti a trattazione e profilazione sono tra i più svariati, tra cui, oltre ai basilari dati anagrafici e fiscalmente, territorialmente e giuridicamente localizzati: lo stato di salute, l'educazione, la composizione e consistenza del reddito, con relativa capacità di spesa, preferenze di acquisto, preferenze sessuali, religiose, culturali, politiche, ecc.

E' sottointeso che molte di queste informazioni, prese singolarmente, potrebbe non avere molto valore, ma, l'insieme degli stessi "agglomerati" dall'elevata capacità analitica esercitata dalle diverse applicazioni dei Big Data (Business Intelligence, Data Mining, ecc.), consente all'ente, organizzazione, etc., che le possiede, di creare dei profili molto accurati, specifici e potenzialmente, precipua predittività di eventuali scelte e futuri comportamenti di ogni individuo.

Il tutto all'insaputa e sinecura delle classi possidenti di tali dati, che, sprovviste di strumenti di "diagnosi" di tali patologie di profilamento e tracciatura digitale, vivono ignare dall'ipotesi che le loro identità personali, personalissime, o quelle dei loro familiari, vengano sottoposte a tali opere di silenzioso ingegno. 


Per riassumere potremmo cosi definire le rappresentazioni dell'individuo nella vita reale e nel web.

- L'identità personale, che potrebbe essere definita, più o meno consapevolmente, "autocostruibile" e identificativa, per ogni individuo, dei propri modelli socio-culturali dal quale, spesso, discendono eventuali proiezioni della personalità sociale.

- L'identità digitale, che definisce un individuo reale nel web, nelle modalità parzialmente limitate, o prestabilite, dallo scopo e dall'utilizzo che ne viene fatto dal creatore, a cui "integralmente". e quasi sempre, appartiene la proprietà delle informazioni e dei dati divulgati.

- Il profilo digitale, che si riferisce ad un "potenziale individuo", poichè creato autonomamente dall'elaborazione di Big data, o dall'agglomerazione algoritmiche del flusso dei dati e delle notizie acquisiti dalle diverse fonti connesse ad internet, tra cui anche l'dentità digitale e l'individuo reale che rappresenta la "matrice" dal quale è stato generato, del quale tuttavia, l'individuo non viene quasi mai a conoscenza e, che, per contro, viene spesso direttamente connesso ed associato all'identità digitale creata "effetivamente" per mano dell'individuo.


La definizione del fenomeno ed il confronto con i Big data

Nel 2018 il volume totale di dati creati nel mondo digitale, è stato di oltre 30 zettabyte (o ZB), uno ZB equivale ad un trilione di gigabyte, ovvero una quantità di memoria complessiva che permetterebbe di archiviare contemporaneamente oltre 200 miliardi di DVD.

Si prevede inoltre che entro il 2025 il volume complessivo dei dati globali arriverà fino a 163 ZB, mentre nel 2035, secondo gli attuali calcoli, addirittura a 2.100 zettabyte.


I dati "generati" dalla rete e dalle interazioni degli utenti 

Il motore principale di questo processo di generazione di dati è certamente Internet, infatti, ogni minuto attraversano  la rete uno smisurato volume infinite richieste di upload e download di file, etc., quali ad esempio:

- 800 mila upload di file su Dropbox, 

- 2,7 milioni di download, 700 mila ore di video visti e 400 ore di video caricati da Youtube, 

- 3 milioni di “mi piace” e 3 milioni di condivisioni, 243 mila foto caricate e 70 mila ore di contenuti video visti su Facebook

- quasi 4 milioni di ricerche su Google,

- 350 mila tweets inviati su Twitter,

- 65 mila foto su Instagram,

- 210 mila Snaps caricati su Snapchat,

- 120 nuovi account creati su Linkedin, 

- 1 milione di foto inoltrate, 29 milioni di messaggi processati e 175 mila video messaggi su WhatsApp,

- 156 milioni di mail inviate,

- 87 mila ore di video visti su Netflix,

- 25 mila posts su Tumblr

- 17 mila video visti su Vimeo,

- 1 milione di swipes e 18 mila accettazioni di incontro su Tinder,

- 500 mila app scaricate, 

- 50 nuove recensioni su Yelp,

- 1000 immagini caricate su Imgur,

- 2 milioni di minuti di chiamate su Skype,

- 5 mila checkins in luoghi su Foursquare,

Tutto questo in 60 secondi, solo per citare alcune delle più note piattaforme di intescambio di dati, e, tuttavia, anche per meglio comprendere, con numeri alla mano, l'enormità del temine "Big Data". 

(Le statistiche sono state elaborate dal rapporto "Indagine conoscitiva sui Big Data", redatto e pubblicato nel 2018, dall'Autorità per le garanzie nelle comunicazioni, dall'Autorità garante della concorrenza e del mercato e dal Garante per la protezione dei dati personali).


Le indagini di Social Media Intelligence, SOCMIT

Sulle basi di queste considerazioni si può, fin da subito, cogliere l'importanza delle diverse discipline di indagine digitale e OSINT, tra cui, anche la Social Media Intelligence, che si occupano di studiare, analizzare e comprendere l'evoluzione di tali fenomeni, nonchè di affinarne eventuali strumenti di sempre più specifica e performante ricerca.

Le stesse infatti, nel panorama economico globale, si posizionano, indiscutibilmente, tra le principali e innovative materie, di strategio valore tecnologico da far "proprie" per affontare gli scenari di impatto internazionale.

Infatti, oltre ai Big del tech, tra i principali player attivi nel comparto troviamo, dal punto di vista delle interlocuzioni nazionali o internazionali, le varie organizzazioni di servizi di intelligenze governativa, mentre, a livello privatistico, esperti indipendenti specializzati nelle singole materie, che spesso sono impegnati in corsi di formazione parastatale, o nell'ambito consulenziale, anche a favore della PA, nonchè agenzie di investigazioni ed investigatori privati, societariamente e tecnologicamente organizzati, nientemeno che per far fronte al fenomeno. 

Negli ultimi anni infatti, sono molti gli esperti che stanno studiando per la messa a punto di sofisticati algoritmini, sistemi e software, che possano, durante un determinato evento – come per esempio un attentato terroristico, una calamità naturale, etc. – possano, in tempi rapidi o rapidissimi, fornire, spesso anche in real time, un quadro aggiornato dell'evoluzione dell'evento attraverso il flusso "virtuoso" dei Big data e, delle informazioni quindi, che condividono i singoli utenti connessi alla rete.

Questi sistemi, che prevendono anche la possibilità di contattare direttamente il singolo utente coinvolto, permettono di aiutare eventuali soccorsi o forze dell’ordine a gestire l'emergenza.

Tali applicazioni tuttavia, presentano ancora molte criticità, quali ad esempio la copertura della rete internet, che spesso dipende dalla densità di popolazione e delle infrastrutture delle reti cellulari, etc., avantaggiando le aree metropolitane piuttosto che gli ambienti rurali.

Un’altra evidente difficoltà è direttamente connessa la volume di dati da analizzare, nonchè alla privacy a cui spesso sono sottoposti. 

I social network rappresentano infatti anche delle sfide tecnologiche più combatture.

Milioni di accessi simultanei ai contenuti, ZettaByte di dati da immagazzinare, normative privacy che possono variare da stato a stato, etc., in poche parole, l’ordine di grandezza tipico dei Big data.

Tuttalpiù che ogni contenuto che viene postato, condiviso, etc., all'interno della rete ha un formato diverso.

Vengono caricati file video, audio, foto, testi e ogni singola allegazione ha una serie di caratteristiche proprie che inficiano la corretta visualizzazione da moltissimi dispositivi diversi, tra cui computer destop, tablet, smartphone, etc.

Per questo motivo, ulteriore disciplina ritenuta tra le più attuale è lo studio delle diverse tecnologie API (Application Programming Interface, etc.), che permettono di maneggiare e confrontare dati provenienti da sorgenti diverse, concetto alla base della "data fusion", cioè la disciplina che studia come integrare dati differenti.


Le indagini digitali di Social Media Analysis

I servizi di social intelligence tuttavia non solo limitati alla gestione di emergenze, difatti, per esempio, possono occuparsi di analizzare i contenuti del singolo utente ritenuto di interesse, allo scopo di ricostruirne, con diverse modalità di penentrante approfondimento, l'esatta presenza, densita od "essenza", nel senso ampio del termine, attraverso la mappatura dei post, delle interazioni, od anche dei contenuti caricati o dall'analisi dei log di accesso alla rete, etc., oppure, oseremmo dire, da ogni frammento di "intinerario digitale" che l'utente ha lasciato dietro di se, percorrendo gli infiniti persorsi della rete.    

Un altro aspetto interessante da studiare riguarda i legami sociali tra le persone: quali, sui social network, collegamenti di uno o più utenti tra loro, o di eventuali collegamenti di contenuti che producono, o con cui interagiscono, attraverso i vari tipi di interazione implementati all’interno del social network, come i like, i commenti e le condivisioni.

Tutte queste interazioni prendono il nome di “engagement”, o di coinvolgimento per l'appunto, prodotto dall'utente.

L'insieme di queste caratteristiche solitamente è la base di partenza di ogni indagine di analisi propria dalla Social Media Intelligence per estrapolare informazioni, notizie e contenuti verso il profilo digitale volta a volta esaminato. 

Le contestuali indagini di Social Network Analysis, comprendono invece, l'insieme di tutte le tecniche che permettono di decifrare i dati raccolti e di ricostruire, al netto di falsi positivi, ovvero di profili che potrebbero "essere" ma non sono, quali eventuali amonimie, o profili duplicati automaticamente da algoritmi, etc., i legami che intercorrono tra i membri di una comunità, con lo scopo di individuare i profili di interesse dall'indagine, all’interno di una rete o scoprire eventuali anomalie e singolarità.

Questa tipologia di indagine digitale, permette, inoltre, di poter identificare, in brevissimo tempo reti di differente natura, che spaziano da legami di parentela o di amicizia, all’insieme delle interazioni all’interno di una pagina o gruppo, passando in rassegna un numero molto elevato di persone, al contrario di quello che avveniva in passato.

La Social Network Analysis, altresì, consente, al richiedente, di individuare eventuali false identità, celate dietro altrettanto falsi profili, utilizzate, sempre più spesso, per la perpetrazione di truffe, raggiri, condotte diffamatorie, nonchè la divulgazione di false notizie, o peggio, per l’adescamento di minori, di cui ogni giorno si rileva un'incessante aumento delle iscrizioni all'interno delle varie piattaforme.

Ruolo chiave viene rivestito anche dall'eventuale "timeline", linea temporale, che organizza i contenuti in ordine cronologico, indispensabile per studiale ed analizzare l’evoluzione e la storia dell'identità nel tempo, quasi a definire un "curriculum vitae" o più correttamente, un CV digitalis, dell'utente, così da poter ricostruire eventualmente, per tramite dei post, o delle discussione intorno ad un argomento, l'esatta evoluzione o la natura dei principlai rapporti che lo animano o, lo legano.


Nell'indagine di intellegence, dal punto di vista tecnico, una delle prime attività da svolgere è certamente l'estrazione dei dati, che solitamente prevede l’utilizzo delle API (Application Program Interface), fornite direttamente dai social network. Tra le quali, ricordiamo, l'impossibilità di raccoglierne quelle eventualmente protette da password, non rese pubbliche, oppure non visibili per le impostazioni di privacy.

I social network inoltre, recentemente, e quasi ad unanimità, hanno considerevlmente diminuito il volume di informazioni rilasciate, motivo per il quale sempre più spesso vengono utilizzati particolari software che permettono l'estrazione per mezzo di "script" di estrazione massiva automatizzata dei dati e dei contenuti di intere pagine web o di piattaforme social, che successivamente subiscono un processo di vera e propria "bonifica" dei dati superflui, sovrabbondanti o di falsi positivi.

Una volta estratti i dati, si passa all’analisi.

Tali dati, spesso elaborati immediatamente, o salvati per subire successive elaborazioni, vengono sottoposti alla disamina di particolari algoritmi finalizzati a poter operare su grandi quantità di dati, come si può facilmente intuirne, gli stessi, hanno necessariamente un'elevata capacità di calcolo e di prestazioni e necessitano, oltre di connessioni molto veloci, di server estremamente performanti, che, non sempre sono accessibili al privato cittadino od a individui di esterni alla professione. Esistono tuttavia società che affittano i propri server di elevatissima capacità di calcolo, a tariffe su mase oraria, giornaliera, o talvolta, per chi lo necessitasse, con prezzi importanti, mensile.  

Le investigazioni sulle fonti aperte, Big data, o più comunemente indagini digitali, oggi, se correttamente svolte, si attestano anche il primato delle attività di indagine più costose, tra le investigazione proposte dal comporto investigativo al rispettivo mercato, in ambito privatistico, di appartenenza (agenzie di invesitgazioni, investigatori privati, esperti forensi, anche in ambito peritale forense, o società di social media engineering, etc.).

Questo sia a fronte dell'attualissima possibilità di accesso, pubblico-professionale, a tecnologie in grado di colmare, in piccola parte, i diversi Gap tecnologici che devono necessariamente superare per ottenere risultati proporzionalmente soddisfacenti, tra cui:

- la capacità tecnologica di poter "avviare" o gestire massive ricerche di dati, informazioni e notizie presenti nella rete, per tramite di software appositamente programmati e automatizzati in seguenze di "query" (stringhe di ipotesi di quesiti di ricerca),

- la possibilità di munirsi delle dotazioni e infrastrutture tecnologiche hardweristiche e softwaristiche, necessarie a poter gestire correttamente l'archiviazione e la successiva disamina quali-quantitativa dei file raccolti.

Tali tecnologie infatti, per evidenti limitazioni di accesso (sono le Big del tech a detenere il monopolio dei brevetti, della produzione, nonchè della commercializzazione ed utilizzo), hanno importanti ricadute in termini di costi e possibilità di utilizzo, ad eccezzione vari enti di intelligence governativa e statale con enormi capacità di investimento.

Sei un esperto, uno studioso o sei interessato alla materia?

Compila il form, puoi proporre un contributo al nostro articolo, oppure presentarci eventuali domande, richieste di approfondimento, nonché personali aspetti di interesse che vorresti né diventassero integrazione.

Ovviamente non rispondiamo ad ogni messaggio, tuttavia li leggiamo tutti con molta attenzione.

Alcuni infatti, richiedono private considerazioni, altri daranno vita alla composizione di apposite, e opportunamente anonimizzate, domande frequenti che pubblicheremo sul sito, i restanti, invece, oltre a poter costituire “oggetto” di apposite prospettive di indagine e verifica, potranno suggerire argomenti di futura trattazione dei nostri articoli.

Grazie per l’eventuale contributo

Buon lavoro a tutti.
Italiana Investigatori Network

Rilascio il consenso *
(GDPR 2016/679 UE)

Investigazioni digitali più richieste

Investigazioni a tutela della reputazione digitale
condividi
Investigazioni digitali
Investigazioni a tutela della reputazione digitale

Il cellulare ha subito una grande evoluzione tecnologica, partendo dall’essere un semplice apparecchio per le telecomunicazioni, fino a diventare uno strumento di business.

Scopri di più
Investigazioni per identificare falsi profili social
condividi
Investigazioni digitali
Investigazioni per identificare falsi profili social

Solo nel 2019, dalle differenti piattaforme digitali sono stati cancellati oltre 10 miliardi di falsi profili, fenomeno che impone una strutturale ridefinizione degli attuali modello di business utilizzati anche dai Big del tech, quali Amazon, Apple, Google, Alibaba, Uber, Airbnb, etc.

Scopri di più
Investigazioni per la lotta alla diffamazione da fake news
condividi
Investigazioni digitali
Investigazioni per la lotta alla diffamazione da fake news

Quelle che un tempo venivano comunemente definite “bufale” vengono, oggi, sofisticatamente ribattezzate “fake news”.

Scopri di più
Investigazioni a contrasto di fake news o notizie pilotate
condividi
Investigazioni digitali
Investigazioni a contrasto di fake news o notizie pilotate

Colpire l'emotività del soggetto destinatario propagando nella rete informazioni distorte.

Scopri di più
Investigazioni sulle fonti aperte, o indagini OSINT (Open Source INTelligence)
condividi
Investigazioni digitali
Investigazioni sulle fonti aperte, o indagini OSINT (Open Source INTelligence)

L’interesse personale di sapere cosa internet dice di ciascuno di noi od in riferimento a determinati soggetti, privati, pubblici, etc.

Scopri di più
Indagini SOCMINT (Social Media INTelligence)
condividi
Investigazioni digitali
Indagini SOCMINT (Social Media INTelligence)

Tali indagini permettono di verificare contenuti e informazioni presenti sui social network, nonchè di correlarne i profili digitali che li animano, all'identità dei soggetti che fisicamente li gestiscono, cosi da poterne identificare eventuali indirizzi di reperimento, recapito, etc.   

Scopri di più
Indagini SIGINT (SIgnals INTelligence)
condividi
Investigazioni digitali
Indagini SIGINT (SIgnals INTelligence)

Raccolta di informazioni attraverso intercettazioni ed analisi delle comunicazioni telefoniche, lo scambio di e-mail ed il monitoraggio del relativo traffico.

Scopri di più