Big Data Metodología

Big Data – Metodología Fase 3, 4 y 5

En el pasado post hablamos sobre las fases iniciales de la metodología utilizada para procesar grandes volúmenes de datos, la fase de Comprensión del Negocio y la de Comprensión de los datos, en donde una vez identificada la problemática procedemos a identificar las fuentes de información y la forma en cómo la vamos a almacenar o capturar, así como realizar un esfuerzo para entender cómo se relacionan los datos o bien crear una fórmula que nos permita relacionar esos datos. Las siguientes fases es donde se involucran los elementos necesarios para procesar la información, siendo estas las siguientes fases:

Plataforma Tecnológica:  Es el diseñar la arquitectura tecnológica que nos permitirá capturar, almacenar, procesar y explotar los datos, es seleccionar los componentes Big Data adecuados.

Tratamiento de Datos: Como su nombre lo indica, su objetivo es capturar, almacenar y preparar la información, en donde la mayor parte de esta información no está relacionada y habrá que almacenar todo tipo de información que nos permita hacer esta tarea, como conocer cuándo se generado, cuándo se ha capturado, dónde se ha capturado y qué se ha capturado; y de esta manera identificar si esa información está en un formato adecuado para que se pueda explotar y analizar, esto mediante una serie de resúmenes gráficos o estadísticos que nos permitan comprender lo que realmente hay en los datos.

Modelización: El objetivo de esta fase es la de construir un modelo analítico a partir de un tablón de datos, es diseñar el tipo de evaluaciones que vamos  a utilizar que nos van a permitir representar los datos de forma comprensible; para tal propósito es necesario utilizar modelos de datos que determinan la forma en como se almacenan, organizan y manipulan los datos; los siguiente son algunos de modelos de datos utilizados:

  • Modelo Tabla
  • Modelo Jerárquico
  • Modelo de Red
  • Esquema Estrella

En nuestro próximo post hablaremos de las siguientes fases de nuestra metodología que nos permitirán alcanzar los objetivos definidos así como seleccionar los componentes más adecuados para el manejo de los datos que se estarán generando.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *