Home Ricerca I Big Data di Twitter e la diffusione dell’Hiv negli Usa: uno studio

I Big Data di Twitter e la diffusione dell’Hiv negli Usa: uno studio

di sert_budrio

I Big Data di Twitter e la diffusione dell’Hiv negli Usa: uno studioDi Federico Guerrini
Twitter potrebbe rivelarsi un valido strumento per prevedere e potenzialmente prevenire la diffusione del virus Hiv.

È quello che ritengono alcuni ricercatori dell’Università della California Los Angeles (Ucla) e di Virginia Tech, autori del recente studio “Methods of using real-time social media technologies for detection and remote monitoring of HIV outcomes ” , pubblicato sulla rivista Preventive Medicine.

Gli scienziati hanno raccolto 550 milioni di tweet apparsi fra il maggio e il dicembre del 2012 e li hanno poi filtrati, evidenziando quelli che contenevano espressioni legate ad attività sessuali o all’uso di droghe – entrambi considerati fattori di rischio per la contrazione dell’Aids. Il campione si è ridotto così a 9.880 tweet, di cui 8.538 avevano a che fare col sesso e 1.342 facevano riferimento all’utilizzo di sostanze stupefacenti.

Sean Young, Caitlin Rivers and Bryan Lewis gli autori dello studio, hanno poi geolocalizzato i cinguettii, per capire da dove provenivano e hanno sovrapposto le informazioni così ottenute a quelle di un’altra mappa contenente dati sulla diffusione dell’Aids negli Usa, prodotta da AIDSVu.org, un progetto di mappe interattive online promosso dall’Università di Emory .

Così facendo, i ricercatori sono riusciti a individuare una “significativa correlazione” fra i tweet che raccontavano comportamenti a rischio e i casi di infezione da Hiv registrati sul territorio americano. Questo sembrerebbe suggerire che in futuro, monitorando il social network alla ricerca di contenuti scabrosi, si potrebbero individuare i segnali di un possibile focolaio della malattia. Ma è davvero così?

Prima di saltare a conclusioni affrettate, è meglio cautelarsi. Che si tratti di predire l’andamento dei titoli di Borsa, l’incasso dei film al box office, o lo scoppio di proteste e rivoluzioni, non è la prima volta che Twitter viene proposto come “oracolo” di avvenimenti futuri. È la natura stessa del network, basato su un continuo flusso di aggiornamenti in tempo reale, relativamente facile da monitorare ed analizzare, che favorisce un tale approccio; non è detto però, che questo porti sempre a conclusioni corrette. Per una serie di motivi: il primo, forse anche il più banale, è che non tutti sono su Twitter. Un’analisi condotta solo tramite il servizio, rischia quindi di offrire una percezione eccessivamente selettiva e distorta del comportamento della popolazione complessiva.

Venendo nello specifico allo studio di Ucla e Virginia Tech, siamo sicuri che basti sovrapporre due sequenza di dati e verificarne la compatibilità geografica, per poter affermare l’esistenza di un qualche nesso fra di loro? Per meglio dire: il fatto di individuare una “correlazione” fra due variabili, non significa che esista per forza un rapporto diretto di causa ed effetto fra esse; in teoria, potrebbe esserci un terzo fattore che le spiega entrambe.

Ma il principale punto debole dello studio, come ammesso dagli stessi ricercatori, è comunque un altro: quello adoperare due serie di dati appartenenti ad archi temporali diversi.

Se i tweet sono stati raccolti nel 2012, i dati sulla diffusione dell’Aids sono del 2009. Ha senso perciò metterli a confronto? Lo studio, scrivono quindi gli studiosi, “è stato pensato per sollecitare ricerche future che indaghino il rapporto costi-benefici di questo tipo di approccio e perfezionino i metodi di utilizzo dei dati provenienti dal social networking per l’individuazione e la prevenzione dell’Hiv”. Un primo tentativo, dunque, da usare come stimolo ma non da prendere come oro colato.

Fonte: http://lastampa.it

Potrebbe interessarti anche

Questo sito Web utilizza i cookie per migliorare la tua esperienza. Daremo per scontato che ti stia bene, ma se lo desideri puoi disattivarli. Accetto Scopri di più