” Mi padre siempre hablaba de un montón de cosas que nunca había hecho y seguro que hizo un montón de cosas de las que nunca hablaba. Estoy intentando reconciliar las dos cosas. “


Supongo (y a veces es mucho suponer) que todos en algún momento nos preguntamos si realmente estamos manejando Big Data o no. Incluso algunos, mas avispadillos ellos, querrán saberlo porque eso marcará un cambio en sus formas de trabajo y de toma de decisiones… ¿ o no?  ( pues no, esa es la respuesta)
Aún así 

¿Cuándo podemos decir que manejamos BIG DATA?

Primero, cuando manejamos un 

Gran volumen de datos. 

 No es tan claro como parece, porque para unos el gran volumen es una cifra y para otros otra. Por ejemplo, ¿Una cuenta de analytics con 20 millones de usuarios únicos mensuales es gran volumen?, bueno, pues puede que si y puede que no, el caso es que aunque fuera un volumen de chorromillones de usuarios por día, el gran volumen de datos no es condición suficiente ( si necesaria) para poder hablar de Big Data.

En Segundo lugar, debemos tener  

Variedad de datos, de tipo de datos  y de fuentes. 

Ahora sí estamos mas cerca del concepto BIG DATA. Ahora, te encuentras con los usuarios de tu web, los de tu canal de youtube, los de twitter, los de facebook, los que escuchan tu podcast, los que compran, etc. Te encuentras con unas cuantas fuentes, cada una de su padre y de su madre, cada una con sus métricas y dimensiones diferentes. En unos casos métricas numéricas (Cuantitativas) y en otras simplemente discurso grupal ( cualitativas), es decir, que además de BIG tienes que tener “VARIETY DATA” y esto ya complica un poco mas el asunto, porque si nos encontramos unos datos que, por ejemplo, podemos obtenerlos minuto a minuto y otros por días… ésto en el mas simple de los casos ¿Cómo haces para mezclar esos datos y obtener algo coherente? ( ya lo veremos no te preocupes).

Pero esto no es todo, con muchos datos y de muchas fuentes y naturaleza diferentes lo que nos encontramos es un caos del tamaño de cien cachalotes, por eso, lo que se hace necesario, en tercer lugar, es un…

Sistema automatizado para tratar, unificar y analizar los datos

Porque de nada sirve todo lo anterior si no tenemos ordenado nuestro cuarto. Podemos tener muy claros nuestros objetivos y nuestros conceptos de análisis, pero si al ir a por los datos necesarios nos encontramos en el trastero de casa (si, confesad, vuestros trasteros son un caos), difícilmente podremos hacer nuestro trabajo y en vez de BIG DATA trabajaremos con una  BIG SHIT que si, que algo podremos hacer con ella, pero no será muy útil, la verdad…

Una vez tenemos claros los conceptos el siguiente paso será el proceso de toma de decisiones en base a nuestro BIG DATA, algo que ahora les ha dado por llamar AGILE DATA, algo así como “ahora que tenemos todos los datos y somos incapaces de tratarlos todos al 100% si queremos tomar decisiones a tiempo tendremos que asumir un pequeño % de incertidumbre a la hora de tomar decisiones”

Pero eso lo veremos en otro post, creo que ahora voy a pedirle a unos tipos que mejor hagan como que se caen y… bueno, eso.

Apúntate a la Newsletter