Las empresas se enfrentan al big data (o grandes volúmenes de datos) y se estima que su volumen se duplica cada 1.2 años. A pesar de todos los beneficios que brinda el big data, el procesamiento de datos de esa magnitud no es necesario para todas las empresas y solo crecerá a medida que tengamos en nuestras manos nuevas aplicaciones para usarlas. Ahora el reto no se basa en generar y capturar más datos, sino se basa en descubrir nuevas formas de condensar, interpretar y tomar decisiones con respecto a estos datos. La clave reside en la visualización de datos, que es uno de los métodos más nuevos y más conocidos para reducir o ilustrar datos de forma simplificada y visual.
No estamos “diseñados” para procesar números complejos y asociar esos números con conceptos abstractos pero si para reconocer patrones visuales de un vistazo. La capacidad humana para el reconocimiento visual de patrones es innata. Por lo cual el representar números complejos como patrones visuales nos permite aprovechar nuestras habilidades analíticas naturales.
Queda claro que el interés en torno a la visualización de datos está en aumento, es una tendencia clara y a la vez una herramienta poderosa para mostrar tendencias y representar datos simples, etc. Pero ¿Cómo se pueden explicar los resultados del análisis complejo de big data o el análisis predictivo o prescriptivo? ¿Soluciona la visualización de datos todos nuestros problemas de comprensión del big data? ¿Cuáles son los límites?
Estos son cuatro posibles límites o “problemas” del concepto de visualización de datos:
Si analizamos el proceso a través del cual las empresas obtienen información, este no ha cambiado mucho en los últimos 30 años, ya que los analistas miran los datos y luego redactan informes. Por otro lado aunque tengamos potentes herramientas de visualización que esperan que el usuario sea un experto en todo tipo de datos y en la selección de las mejores técnicas para visualizar y representar los datos.
Uno de los mayores atractivos de la visualización es su capacidad para tomar grandes volúmenes de datos y simplificarlos de una forma sintética y a la vez comprensible. Sin embargo, puede inducirnos a sacar conclusiones infundadas, si solo tratamos de tomar millones de registros de datos y limitar sus conclusiones a unas cuantas gráficas de un cuadro de mando, ya que podríamos descuidar por completo ciertos modificadores significativos que podrían cambiar por completo las suposiciones y o hacerlas inexactas.
Este es el mayor problema potencial, y también el más complicado. Cualquier algoritmo utilizado para reducir los datos a ilustraciones visuales se basa en las aportaciones humanas, y las aportaciones humanas pueden ser fundamentalmente erróneas. Por ejemplo, un programador que desarrolla un algoritmo puede resaltar los diferentes datos que son «más» importantes a considerar y descartar completamente otros, lo que no seria ideal para todas las empresas y situaciones, especialmente si hay datos atípicos o situaciones únicas que exigen un enfoque alternativo. El problema se agrava por el hecho de que la mayoría de los sistemas de visualización de datos se implementan a escala global y se convierten en algoritmos que se adaptan a todos, y no abordan las necesidades específicas de de cada usuario.
Los gráficos son excelentes para transmitir ideas simples rápidamente, pero a veces no son suficientes. Si las palabras pudieran ser reemplazadas por pictogramas, lo hubieran sido hace mucho tiempo. Para expresar una situación compleja, se requieren oraciones y frases junto con un sistema que sea lo suficientemente inteligente como para articular su proceso de razonamiento. Más allá del dashboard automático, lo realmente valioso den la toma de decisiones que lleva a la acción es la narrativa de los datos con el componente de conocimiento contextual. Es importante destacar que el lenguaje también se asegura de que el usuario final realmente entienda.
Quizás la inteligencia artificial con el Natural Language Generation (NLG) ofrece algún tipo solución al redactar automáticamente una narración que explica las ideas y los factores detrás de los cambios en los datos. Queda claro que el futuro de la capacitación irá hacia el data story telling. Como vemos big data puede esperar: la visualización de datos no.
[…] https://ignasialcalde.es/4-retos-en-la-visualizacion-de-datos/ […]