¿Cómo escoger la gráfica correcta para presentar nuestros datos?

La visualización de datos es una gran parte de los trabajos de un analista de datos, en las primeras etapas de un proyecto, a menudo estarás haciendo una exploración de los datos para obtener algunos conocimientos sobre los mismos. La creación de visualizaciones realmente ayuda a que las cosas sean más claras y fáciles de entender, especialmente con conjuntos de datos más grandes y de gran dimensión. Hacia el final de su proyecto, es importante poder presentar los resultados finales de una manera clara, concisa y conveniente que su audiencia, que a menudo son clientes no técnicos, pueda comprender.

En términos generales, la visualización de datos es dibujar una imagen con sus datos en lugar de dejarla en una hoja de cálculo o tabla.

Técnicamente, cualquier forma puede ser elegida para su uso, pero hay algunos gráficos que son mucho mejores para contar una historia específica. Para entender mejor esto, se han clasificados cuatro tipos básicos de presentación que se puede usar para presentar los datos:

  • Compescoger la gráfica correcta para presentar nuestros datososición: toman un valor total y descubren qué componentes constituyen ese total. Los gráficos de composición pueden ser estáticos, mostrando la composición actual de un valor total, o pueden mostrar cómo la composición de un valor total cambia a lo largo del tiempo.
  • Distribución: se utilizan para explorar cómo se agrupan los valores dentro de los datos. Los gráficos de distribución le muestran la forma de sus datos, el rango de sus valores y posibles valores atípicos.
  • Comparaciones: se utilizan para comparar valores entre sí. Muestran las diferencias entre valores, como la diferencia entre varias categorías o cómo los valores cambian a lo largo del tiempo.
  • Relación: sirven para explorar cómo se relacionan los valores entre sí. Un gráfico de relación le permite encontrar correlaciones, valores atípicos y clústeres de datos.

Lo más probable es que utilices solo los dos tipos más comunes de análisis de datos: comparación o composición.

Para determinar qué gráfico es el más adecuado para cada uno de estos tipos de presentación, primero debes responder algunas preguntas:

  • ¿Cuántas variables quieres mostrar en un solo gráfico?, una dos, tres o muchas.
  • ¿Cuántos elementos o puntos de datos mostrarás para cada variable?, unas pocos o muchos.
  • ¿Mostrarás valores durante un período de tiempo o entre elementos o grupos?

Veamos ahora los distintos tipos de gráficas y en donde podemos utilizar cada una de ellas.

Gráficos de columnas – Column Charts

escoger la gráfica correcta para presentar nuestros datosLos gráficos de columnas son probablemente el tipo de gráficos más utilizados. Este cuadro se utiliza mejor para comparar diferentes valores cuando los específicos son importantes, y se espera que los usuarios busquen y comparen en valores individuales entre cada columna.

Con los gráficos de columnas, puedes comparar valores para diferentes categorías o comparar cambios de valores durante un período de una sola categoría.

Existen muchos tipos de gráficos de columnas, pero las más utilizadas e importantes son:

Histograma de columna: el histograma es una variación común de los gráficos de columnas utilizados para presentar la distribución y las relaciones de una sola variable en un conjunto de categorías. Un buen ejemplo de un histograma sería una distribución de calificaciones en un examen escolar.

Gráficos de columnas apiladas: usa estos gráficos para mostrar una composición. No uses demasiados elementos de composición, no mas de tres o cuatro, y asegúrate de que las partes que componen son relativamente similares en tamaño. Se puede desordenar muy rápido.

Este tipo de gráfico se utiliza en las siguientes ocasiones:

  • Composición: cuando hay cambios en el tiempo, pero con muy pocos periodos, se pueden utilizar los histogramas de columna o los gráficos de columnas apiladas. Sin embargo, si no hay cambio en el tiempo, pero se quiere evaluar los componentes también pueden ser utilizados.
  • Distribuciones: se puede emplear el histograma de columnas, cuando se tiene una sola variable y pocos datos.
  • Comparaciones: se puede utilizar al comparar ítems con muchas categorías, a sí como también, cuando se requiere comparar en el tiempo con pocos periodos y se cuenta con pocas categorías.

Gráficos de barras – Bar Chart

escoger la gráfica correcta para presentar nuestros datosLos gráficos de barras son esencialmente gráficos de columnas horizontales. Si tienes nombres de categorías largos, es mejor usar gráficos de barras porque brindan más espacio para texto largos. También debes usar gráficos de barras, en lugar de gráficos de columnas, cuando el número de categorías sea mayor que siete, pero no más de quince, o para mostrar un conjunto con números negativos.

Al igual que los gráficos de columnas, los de barras existen muchos tipos, los principales son los siguientes:

Histograma de barras: los gráficos de barras se pueden usar para presentar histogramas. Un buen ejemplo de histograma es una distribución de la población por edad y sexo.

Gráficos de barras apiladas: se utiliza cuando se quiere hace énfasis en la composición y se cuenta con solo unas pocas variables. Las barras apiladas no son buenas para comparar o analizar relaciones, la única línea de base común se encuentra a lo largo del eje izquierdo del gráfico, por lo que solo puede comparar de manera fiable los valores de la primera serie y la suma de todas las series.

Estos tipos de gráficos se utilizan de la siguiente manera:

  • Comparaciones: se puede utilizar al comparar ítems con pocas categorías.

Gráficos de líneas – Line Chart

escoger la gráfica correcta para presentar nuestros datosEl propósito de un gráfico de líneas es mostrar tendencias, aceleraciones o desaceleraciones y volatilidad, muestran relaciones en cómo los datos cambian en un período de tiempo.

Demasiadas líneas o variables pueden hacer que el cuadro sea complicado y difícil de descifrar, por lo que se tenga que hacer referencia constantemente a la leyenda para recordar qué es lo que esta mirando.

Los gráficos de líneas se utilizan normalmente de la siguiente forma:

  • Distribuciones: cuando se cuenta con una sola variable, pero con muchos datos.
  • Comparaciones: cuando se hacen comparaciones en el tiempo y se tienen pocos periodos y muchas categorías, y también cuando se tiene muchos periodos y la data no es cíclica.

Gráficos de área – Area Chart

escoger la gráfica correcta para presentar nuestros datosEl gráfico de área está estrechamente relacionado con el gráfico de líneas, ambos tipos de gráficos muestran una relación de series temporales, muestran continuidad en un conjunto de datos y son buenos para ver las tendencias en lugar de los valores individuales.

Un gráfico de área es lo mismo que un gráfico de líneas, simplemente con más color, el problema con el que seguramente te encontrarás es que las capas superiores oscurecen las capas inferiores, aunque puedes jugar con transparencia, pero después de tres variables, los gráficos de áreas son difíciles de leer.

Un tipo de gráficos de área es el siguiente:

Gráficos de área apiladas: se usan mejor para mostrar los cambios en la composición a lo largo del tiempo. Un buen ejemplo serían los cambios de la cuota de mercado entre los principales jugadores o las participaciones en los ingresos por línea de productos durante un período de tiempo. Estos gráficos pueden ser coloridos y divertidos, pero debes usarlos con precaución, ya que pueden convertirse rápidamente en un desastre. No los uses si necesitas una comparación exacta y no acumula más de tres o cinco categorías.

Este tipo de gráficos se implementan de la siguiente forma:

  • Composiciones: cuando existe cambio en el tiempo y se tiene muchos periodos.

Gráficos circulares – Pie Chart

escoger la gráfica correcta para presentar nuestros datosEstos cuadros se encuentran entre los gráficos más utilizados y también mal utilizados. Un gráfico circular generalmente representa números en porcentajes, que se utilizan para visualizar una parte de una relación completa o una composición. Los gráficos circulares no están destinados a comparar secciones individuales entre sí o a representar valores exactos, para ello debes usar un gráfico de barras.

Cuando sea posible, evite los gráficos circulares, la mente humana piensa linealmente, pero, cuando se trata de ángulos y áreas, la mayoría de nosotros no puede juzgarlos bien.

Este tipo de gráficos se emplean de la siguiente forma:

  • Composiciones: se utiliza cuando se tiene una muestra simple total.
  • Comparaciones: se implementa cuando se hacen comparaciones a través del tiempo cuando se tiene muchos períodos y la data es cíclica.

Gráficos de dispersión – Scatter Chart

escoger la gráfica correcta para presentar nuestros datosLos diagramas de dispersión se usan principalmente para el análisis de correlación y distribución. Es bueno para mostrar la relación entre dos variables diferentes donde una se correlaciona, o no, con otra.

Los gráficos de dispersión también pueden mostrar la distribución de datos o las tendencias de agrupamiento y ayudarlo a detectar anomalías a valores típicos. Un ejemplo sería un gráfico que muestra el gasto de marketing frente a los ingresos.

Estos tipos de gráficos se utilizan de la siguiente forma:

  • Distribuciones: cuando se tiene dos variables.
  • Relaciones: cuando se tiene dos o tres variables.

Existen muchos otros tipos de gráficas, pero están son las más comunes, en resumen, se puede decir que los gráficos de barras son buenos para las comparaciones, mientras que los gráficos de líneas funcionan mejor para las tendencias. Los gráficos de diagrama de dispersión son buenos para las relaciones y las distribuciones, pero los gráficos circulares solo deben usarse para composiciones simples, nunca para comparaciones o distribuciones.

Por su parte las gráficas de cada uno de los tipos básicos de presentación (composición, distribución, comparación y relación) las puedes descargar a continuación:

Guía como escoger una gráfica para la visualización de datos

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *