20minutos

Big Data: qué es y cómo funciona

En nuestro día a día compartimos fotos, vídeos, gustos, aficiones…Enviamos gran cantidad de información constantemente. Proporcionamos datos que son analizados a conciencia por las empresas para conocer mejor a sus consumidores. Lo hacen gracias a lo que se conoce como Big Data, un sistema en el que muchas ya han invertido grandes sumas de dinero. Pero, ¿qué es realmente?

meneame
Compartir

Definimos Big Data como el proceso de recolección y análisis de grandes cantidades de información. La complejidad y el gran volumen de datos impiden que estos puedan ser analizados por los medios tradicionales. Lo que hace diferente al Big Data respecto a otro tipo de mecanismos utilizados para la gestión y el análisis son las 5Vs: volumen, velocidad, variedad, veracidad y valor.

Volumen

Como destacábamos anteriormente, los niveles de datos que maneja Big Data son muy elevados (terabytes o petabytes), estos anteriormente no podían manejarse porque no existía tecnología pertinente para ello.

Variedad

La información proviene diversas fuentes lo que hace que se puedan comparar diferentes puntos de vista.

Velocidad

La rapidez es una de las características comunes de los últimos avances tecnológicos. Vivimos en una sociedad a la que no le gusta la espera y valora de forma positiva el poder tener los datos que demanda, ya clasificados y procesados, en el menor tiempo posible.

Veracidad

Que sean verdaderos y se ajusten lo máximo posible a la realidad permite matizar las decisiones futuras.

Valor

Los datos tienen que ser útiles para quien los va a manejar, el valor se añade tras su análisis.

¿Para qué sirve el Big Data?

En el mundo de los negocios, el Big Data proporciona información a las empresas. Les permiten fijar de forma más estratégica sus objetivos, centrando sus acciones en utilizar y sacar partido a las nuevas oportunidades que pueden aparecer entre estos datos e incluso, abandonar aquellos objetivos o estrategias que les resulten más problemáticas. Uno de los campos donde es más útil este sistema es el marketing. El análisis de más variedad de datos permite conocer mejor los gustos o deseos de los clientes y poder ofrecer así productos nuevos que satisfagan sus necesidades.

La industria del turismo, la salud o los mercados financieros lo utilizan en sus sistemas de trabajo. Recopilar valoraciones de clientes, registrar el número de pacientes de un hospital con sus informes clínicos o evaluar de forma eficaz los posibles riesgos que pueda tener una inversión, son algunos de los ejemplos de su función.

¿Cómo se organizan los datos?

Existen tres categorías. La primera recoge datos que incluyen informaciones sobre clientes o fechas y se agrupan en tablas aunque, existen otros tipos de datos como imágenes, vídeos o audios que se clasifican como datos no agrupados porque no se pueden clasificar con este método. La segunda recoge datos más detallados y que están relacionados con actividades comerciales como pueden ser las valoraciones, encuestas, registros de ventas, etc. Los últimos están relacionados con las interacciones sociales como por ejemplo, los datos que aportan las redes sociales.

Desventajas del Big Data.

Analizar gran cantidad de datos también conlleva que los estándares de calidad disminuyan. Es complicado seleccionar datos bajo unos criterios de calidad y ofrecerlos con la máxima inmediatez posible ya que se necesita tiempo para poder estructurar los datos obtenidos y desechar aquellos que no valgan.

Estos datos están en constante cambio. Se analizan de forma muy rápida pero la validez de muchos de ellos puede ser muy corta. La solución a este problema la encontramos en la capacidad de procesamiento, cuanto más alto sea, mayor vida útil tendrán. La volatilidad de los datos puede desencadenar errores que trasciendan a la hora de tomar decisiones.

La protección de datos es otra de las vertientes para analizar. Según la normativa los datos personales no pueden utilizarse con una finalidad diferente a la inicial. Esto hace referencia al principio de finalidad, que limita los proyectos del Big Data.