+39 0376 369728 [email protected]

Big data, non più per pochi

Tempo di lettura ≈ 5  min.

Con l’avvento dei Big Data, un nuovo mondo, letteralmente, è stato creato negli ultimi anni. È quello realizzato grazie alla quantità di dati che generiamo ormai non solo giornalmente, ma ogni secondo. Le statistiche che riguardano la quantità di dati che produciamo sono, in effetti, sbalorditive. E secondo ogni previsione, non faranno che crescere.

Big Data, Big Data ovunque

I Big Data non sono più questione riservata a pochi, immensi colossi informatici. Parlando di Big Data non è più possibile riferirsi solo alle famose Big Four, o GAFA (Google, Amazon, Facebook, Apple). Certo, l’uso che queste big tech companies fanno dell’enorme quantità di dati che generiamo è precluso a quasi qualsiasi altro attore sulla scena mondiale, escluso forse Windows. Possono stoccare e immagazzinare tantissimi dati, noti solo a loro, rielaborarli con software e potenze di calcolo eccezionali. E i risultati sono già sotto i nostri occhi.

Ma è tutto il mondo in cui viviamo a essere ormai un mondo di Big Data, in cui questi dati noi li generiamo pressoché ogni secondo, con diverse scelte, comportamenti e attività. Dati che riguardano le nostre abitudini, i nostri gusti, le nostre preferenze. Fino ad alcuni anni fa era necessario sedersi davanti a un computer, accenderlo, eseguire un accesso a internet, navigare e fornire personalmente i propri dati.

Ora basta molto meno: la straordinaria diffusione della connettività costante portata da smartphone, tablet, smart watch e compagnia navigante ha portato a una costante generazione di dati. E siamo solo all’alba, soprattutto in Italia, per l’Industria 4.0, l’Intelligenza Artificiale e l’Internet of Things. Ma i dati che produciamo ogni giorno non riguardano solo social e shopping online: riguardano dati scientifici, istituzionali, di ricerca, aziendali, e chi più ne ha più ne metta.

Siamo sempre connessi, condividiamo e generiamo. Ma questo non è un articolo sui big data; o meglio lo è, ma incidentalmente.

Tutti i dati del mondo a portata di clic

Come sosteneva Bernard Marr in un suo vecchio articolo su Forbes, tra il 2013 e il 2015 abbiamo prodotto più dati che in tutta la storia dell’umanità fino ad allora. È facile presumere che ora quella quantità di dati venga generata anche in un solo anno, se non di meno. Sta infatti partendo la corsa all’invenzione di nuove, sempre maggiori, unità di misura per le quantità di dati. Tanto che si presume che nel 2020 ci saranno circa 44 zettabyte di dati che circoleranno per il globo.

44 zettabyte di dati sono 440 miliardi di gigabyte. Quasi tutti i dati generati dall’uomo sono ormai digitali; una quantità sorprendente, che passa dai dati inviati dai satelliti e dalle sonde spaziali alle foto di gattini caricate su Facebook. Tutto lo scibile umano, o quasi, è ormai digitale. Ecco alcuni dati estrapolati da un più recente articolo su Forbes.

  • Più del 50% delle nostre ricerche online è condotto da smartphone. E in media, Google processa oltre 70.000 ricerche al secondo. Sono più di 4 miliardi di ricerche al giorno. Il che significa che, numericamente, in meno di due giorni ogni singolo abitante della Terra fa una ricerca su Google;
  • E naturalmente non parliamo solo di Google. Considerando tutti i motori di ricerca, le ricerche salgono a circa 6,5 miliardi al giorno. Praticamente una per ogni persona sulla Terra;
  • Ogni giorno quasi 4,5 miliardi di persone accedono a internet;
  • Inviamo circa 2,8 milioni di e-mail al secondo, per oltre 240 miliardi di e-mail al giorno. Quasi 25 e-mail per ogni persona sulla Terra;
  • Ogni giorno, generiamo 2,5 quintilioni di gigabyte di dati.

Le stime dicono che nel 2020 ogni persona sulla terra genererà 1,7 megabyte di dati ogni secondo. È un’enorme quantità di informazioni che ognuno di noi mette in circolazione.

Quanti gattini postiamo su Facebook?

Quello del gattino è ormai uno degli stereotipi cardine e dei luoghi comuni più diffusi sull’uso di Facebook (pur non negando che anche i cari animali domestici abbiano avuto una diffusione esponenziale con l’avvento dei social network). Ma sui social quanto dati generiamo?

Non solo Facebook, prima di tutto. Il social blu è certamente un canale che punta a essere il più onnicomprensivo possibile, ma esistono ancora altri canali più specializzati e dedicati alla diffusione di certi tipi di contenuti (Youtube per i video, Instagram per le foto) e, quindi, di dati.

Facebook è chiaramente il re dei social, con quasi 2,5 miliardi di utenti attivi. A ruota c’è Youtube, con quasi 2 miliardi di utenti, e Instagram, con 1 miliardo. Senza dimenticare Whatsapp, che tecnicamente è un’app di messaggistica, che vede un miliardo e mezzo di utenti attivi. E ognuno di questi utenti genera dati. Ma quanti? Ogni minuto:

  • Carichiamo 53.000 foto su Instagram. Fino a questo momento, quest’anno sono state pubblicate quasi 2,7 miliardi di foto;
  • Guardiamo 4,6 milioni di video su Youtube;
  • Pubblichiamo quasi 90.000 post su Tumblr.

Per quanto riguarda Facebook, invece:

  • Ogni secondo creiamo oltre 5 nuovi profili;
  • Carichiamo 300 milioni di foto al giorno;
  • Ogni minuto postiamo oltre 510 mila commenti e 293 mila aggiornamenti di stato;
  • Ogni giorno vengono pubblicate 450 milioni di storie su Whatsapp, 400 milioni su Instagram e 300 milioni su Facebook (certo in molti casi queste coincidono).

Come comunichiamo?

Ovviamente, comunichiamo online. Non solo tramite i social ma, principalmente, con le app di messaggistica. Ogni giorno inviamo oltre 65 miliardi di messaggi su solo su Whatsapp, 240 miliardi di e-mail, facciamo più di 5 milioni di chiamate via Skype.

Alla luce di questa mostruosa quantità di dati, appare evidente come i Big Data non siano solo a portata di poche, enormi compagnie, ma di molte altre imprese che decidano di sfruttarne l’enorme potenzialità. Ovviamente il modo in cui i dati vengono raccolti, la quantità che viene immagazzinata e, soprattutto, la velocità di calcolo, sono determinanti per ottenere un vantaggio determinante in questo settore. In questo senso le Big Four, com’è ovvio, hanno un indiscusso vantaggio.

Cosa server per gestire tutti questi dati?

Qui i dati sono molto più fumosi e frutto di stime e congetture perché, naturalmente, le grandi compagnie non divulgano i dati interni, come quantità o dislocazione dei propri server e data center. Secondo le stime di CloudTweaks, solo Google gestisce 10 exabyte di dati, ovvero 10 miliardi di gigabyte.

Eppure, sembra che la compagnia che gestisce il maggior numero di server, nel mondo, sia Amazon. Il colosso dell’e-commerce sfrutta circa 1 miliardo di gigabyte di dati, distribuiti su oltre 1,4 milioni di server. Google e Microsoft dovrebbero possedere circa 1 milione di server ciascuno ma anche questa, ovviamente, è una stima. Così come quella che riguarda Facebook, che avrebbe “centinaia di migliaia” di server per ospitare gli oltre 500 terabyte di dati che genera giornalmente.

Il dato è tratto

Come detto, il futuro dei dati online è in deciso aumento. Raggiungeremo i famosi 44 zettabyte di dati nel 2020? Più che probabile. Il punto della questione, ormai, non è raccogliere dati. Di quelli ce ne sono in abbondanza, e saranno sempre più. La vera questione riguarderà l’uso che faremo di questi dati. Dalla Machine Learning all’Artificial Intelligence, è un intero universo quello che si sta aprendo davanti a chi avrà il coraggio, e i mezzi, per intraprendere questa direzione.

Dalle previsioni elettorali alla prevenzione delle epidemie, dall’ottimizzazione dei trasporti all’Internet of Things, oltre naturalmente a Customer Experience personalizzata e Advertising individuale. Tutto passa attraverso quei miliardi di gigabyte. Aziende, istituzioni pubbliche e private, università, enti di ricerca. Come quantità di dati, ogni giorno ne generiamo più di tutta l’umanità prima dell’avvento di internet.

Li useremo nel modo giusto? Sapremo trarne vantaggio? Siamo qui proprio per scoprirlo.