Pasar al contenido principal
Imagen
Estadística descriptiva, explorando el Big Data

Estadística descriptiva, explorando el Big Data

Tecnología | Artículo
  • Enero 2018
  • Fecha de publicación
  • Enero 2018
  • Tecnología
  • Artículo
Texto

El papel de la estadística descriptiva es fundamental para el conocimiento de los datos que tenemos a nuestro alrededor. Y es que, vivimos en la era de los datos: en la actualidad, emitimos y recibimos datos desde Internet con nuestros móviles, smartwatches y tarjetas de crédito.

Nos movemos y nuestra posición queda registrada a través del GPS. Compramos en tiendas y pagamos con nuestra tarjeta de crédito. Accedemos al gimnasio con una pulsera que nos monitoriza las actividades. Usamos básculas digitales para pesarnos, vemos la tele en una Smart TV e, incluso, escuchamos nuestras listas preferidas de canciones en el móvil. Cualquier acción que realizamos queda plasmada a través de datos que generamos, nuestro rastro o huella digital.

Las empresas que sepan cómo captar esos datos, analizarlos para conocer los comportamientos de sus clientes y tomar decisiones basadas en ellos, obtendrán una clara ventaja frente a los competidores.

Estas empresas capturan diariamente miles de millones de datos, no sólo sobre sus clientes, también sobre sus proveedores y sus operaciones. Estos datos los obtienen de dispositivos móviles, sensores, redes sociales, GPS o vídeos en YouTube, por citar sólo algunos ejemplos. Llegan, por tanto, de fuentes de diferentes formatos, estructurados, semiestructurados y no estructurados, y los procesan tanto en tiempo real como en lotes de información.

Estadística descriptiva, primer paso en análisis de datos 

Enormes volúmenes de datos, de diferentes formatos y fuentes, son ingestados en plataformas Big Data para después procesarlos y analizarlos. Explorar estos datos es la primera etapa del análisis de datos, y esto lo hacemos con la ayuda de la estadística descriptiva.

Si los datos son incoherentes o erróneos, su procesamiento nos dará resultados erróneos y la toma de decisiones no se podrá realizar basándonos en estos datos. Para poder procesarlos y extraer información válida, es necesario que los datos sean correctos.

Para ello, el primer paso necesario que tenemos que dar una vez ingestados los datos en las plataformas Big Data, es utilizar las técnicas de estadística descriptiva que nos dejen conocer la estructura de los datos, el tipo de datos que nos permiten saber qué algoritmos manejaremos.

Además, la estadística descriptiva nos permite verificar la calidad de nuestros datos y su validación. De esta manera, asegurarnos que los datos que tenemos son completos y que la etapa previa del diseño del análisis era correcta.

La estadística descriptiva nos permite, también, conocer los primeros insights de negocio, con los cuales podremos reorientar nuestra definición del problema a resolver.

Usando estadística descriptiva podemos, además, obtener la representación de los datos de una manera visual y descriptiva. Esto nos posibilita el explorar la información tan valiosa contenida en los datos y aprovechar esta mediante técnicas de machine learning y data mining para modelarlos aprovechando el conocimiento de sus distribuciones.

Así, por ejemplo, dependiendo de si nuestros datos tienen una moda o varias (distribuciones multimodales), podremos decidir si dividir la población en tantas como modas tengamos y usar un algoritmo de machine learning para cada una de ellas. O bien, conocer si algún intervalo en una variable predictora está impactando más a nuestro objetivo de negocio.

Es fundamental en todo proceso de Data Science que los datos tengan calidad para sacar conclusiones correctas. Si los datos no son buenos, los análisis que hagamos no serán válidos y no podremos utilizarlos para negocio, con lo que no podrán tomar decisiones correctas basadas en los datos. Para que las empresas sean Data-Driven companies, es requisito imprescindible utilizar la estadística descriptiva como la primera fase que debemos abordar en el análisis.

El papel de la estadística descriptiva es, pues, fundamental para el conocimiento de los datos. ¿Te atreves a usarla?

Si quieres seguir aprendiendo sobre análisis de datos y las posibilidades que brindan a cualquier empresa, fórmate con el Programa Superior en Data Science de ICEMD. Toda la información e inscripciones, aquí.

  • Fecha de publicación
  • Enero 2018
  • Tecnología
  • Artículo

También te puede interesar

Quo vadis, marketing?

Marketing y Comunicación

En el libro que editó ESIC con motivo de los 50 años de su fundación, Simón Reyes, quien fuera su director general, afirma:  El marketing en el que creemos en ESIC es un marketing que contri...

Gestiona el perfil de tu marca en Instagram de una manera profesional

Marketing y Comunicación

El feed de Instagram es la carta de presentación de tu marca. Apenas tienes unos segundos para que un usuario se quede o huya despavorido. A continuación, voy a recomendarte algunas estrategias y he...

Next generation: la propuesta para recuperar Europa

Comercial y Ventas

Llevamos ya unas cuantas semanas concentrados preparando nuestro respectivo «día después» —ese momento tan esperado por todos, social y económicamente—, actualizando la agenda, organizando ac...