Big Data.

¿Qué es BIG Data?

Debido al gran avance que existe día a día en las tecnologías de información, los sistemas enfrentan nuevos desafíos que les permitan analizar, descubrir y entender más allá de lo que sus herramientas tradicionales reportan sobre su información. Al mismo tiempo durante los últimos años el gran crecimiento de las aplicaciones disponibles en internet, ya sea de geo-referencias, redes sociales, etc. y que muchos instrumentos y máquinas también tienen la capacidad de poner sus datos en la WEB, genera que esta disponibilidad de información es parte importante en las decisiones de negocio de las empresas.

Hardware disponible.

Hoy las capacidades de almacenamiento dejaron de ser un problema, existen servidores especializados para el manejo de grandes volúmenes de datos, sumando a esto la posibilidad de manejar varios servidores interconectados, se pueden considerar sistemas capaces de manejar Big Data.

Cuál es la diferencia.

El BIG DATA, permite pensar en sistemas que en base a los datos disponibles asuman tareas predictivas, de aprendizaje, manejo de conocimiento y más.

A modo de ejemplo antes del BIG DATA, un sistema de mantención de vehículos aspiraba a manejar seguramente un maestro con sus datos básicos tales como patente, planes de mantención preventiva, registrar eventos de mantención preventiva y correctiva. Hoy con el BIG DATA, se puede incluir la documentación de usuario y técnica, puede disponer de muestras de sensores de ubicación, revoluciones del motor, temperatura de agua y aceite y muchos otros cada 20 segundos y seguramente dentro de poco entre sus datos almacenados estará el código que permite su conducción automática o semi-automático.

Claves para que funcione.

1.       Equipos: Se debe disponer de uno o más servidores interconectados con dos tipos de almacenamiento uno de gran capacidad con discos SAS o SATA, y uno de menor capacidad pero con discos de alta velocidad o discos electrónicos. A lo anterior se debe sumar una gran cantidad de memoria RAM, con el objeto de que respondan a los requerimientos de información en tiempos adecuados.

2.       Los sistemas deben contemplar aplicaciones que permitan poner en los discos rápidos la información que seguramente solicitarán los usuarios.

3.       Interfaces: Considerando que los datos procederán desde fuentes tan diversas como ingresos manuales de los usuarios, otros sistemas de información y/o máquinas conectadas, se debe disponer de aplicaciones que permitan manejar múltiples protocolos e intercambiar la información en tiempos adecuados a los requerimientos de información del sistema.

4.       Diseño de bases de datos: El desafío principal es asegurar la recuperación de los datos almacenados a una velocidad adecuada, para esto se debe considerar organizar la información en una o más capas desde los datos de detalle, a partir de los que se generan una o más capas de datos semi elaborados que finalmente entreguen resultados a los usuarios.