Ya son 3 las entregas que hemos realizado en donde abarcamos los aspectos básicos del Big Data, en esta 4ta entrega vamos a resumir la definición y empezaremos a ahondar en algunos aspectos técnicos.

El Big Data nos ha permitido pasar de una analítica tradicional, en donde la persona, el científico, toma la información desde una base de datos o ficheros los cuales están almacenados en forma estructurada a empezar el procesamiento de la información que no lo es, información que está en formatos como imágenes, documentos o inclusive audios.

Esto nos ha llevado a ir modificando nuestra manera de ver las cosas, y este caso a la modificación de los paradigmas en la computación, pasando de una computación centrada en servidores y supercomputadoras a una computación centrada en sistemas distribuidos que permiten a estos a comunicarse entre sí y coordinarse mediante el envío de mensajes para lograr un mismo objetivo, adquiriendo de esta manera características como la concurrencia, escalabilidad y mayor tolerancia a fallos siendo así más seguros.

Cuando hablamos de Big Data, no solo hablamos de los datos o de la información per se, sino de algo más importante que es lo que hacemos con esos datos, es por ello que al Big Data le caracterizan las denominadas 7 V’s:

Las 3 V’s de los datos

Volumen – Variedad – Velocidad

Las 5 V’s del uso de los datos

Valor:  ¿Cómo podemos extraer valor a estos datos?.

Veracidad: ¿Cómo podemos asegurar que la información que realmente hay en esos datos es correcta?

Visualización: Toda esa cantidad de información ¿Cómo puedo yo resumirla y mostrarla a un usuario de forma que entienda lo más importante?

Variabilidad: ¿Cómo podemos mantener estables, procesos y procedimientos que involucren a datos y que no vayan perturbándose en el tiempo?

Para hablar con más detalle de estás 5 V’s, en donde la intención no solamente radica en capturar y almacenar información, sino en su tratamiento para generar valor al negocio; esto mediante el uso de metodologías adecuadas para procesar esta información. Esta metodología de la que hablamos consta de las siguientes 8 fases:

1. Comprensión del negocio, saber cuál es el problema y cuál es el objetivo

2. Compresión de datos, saber cuáles son los datos necesarios para resolver el problema

3. Plataforma tecnológica, donde vamos a trabajar, con que tecnología, con que componentes

4. Tratamiento de datos, como vamos a tratar los datos, como se van a integrar, que vamos hacer con ellos

5. Modelización, crear modelos que nos permitan extraer conocimiento de los datos

6. Presentación de los resultados

7. Despliegue, hacer el despliegue del modelo una vez obtenidos las aprobaciones de los involucrados

8. Puesta en valor, cómo vamos a utilizar el modelo

One thought on “Big Data – Metodología

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *