Te doy la bienvenida a esta lección, donde aprenderás de la importancia de la visualización de los resultados, ya que nos ayuda a encontrar patrones entre los datos durante nuestro análisis o a presentar la información de manera sencilla y entendible para el receptor final, por ejemplo: un área gerencial o de proceso.

¿Qué herramientas existen en los lenguajes aprendidos en el curso para la visualización de datos?

En el presente tema, se revisarán los aspectos más importantes sobre la visualización de datos en cada uno de los lenguajes aprendidos durante el curso, con la finalidad de que tengas una comprensión extensa, poseas la capacidad de trabajar, y desarrolles presentaciones de información con las herramientas para ambos lenguajes.

Los lenguajes R y Python tienen la capacidad de generar diferentes gráficas, las cuales nos ayudan a comprender los datos que se trabajan al realizar un primer análisis visual y al comenzar a formar conclusiones iniciales. Entre las diferentes gráficas para ambos, podemos señalar las siguientes:

Barras

Este gráfico es conveniente cuando se tienen variables dependientes asociadas por tratamientos. Nos señala la frecuencia con la que se visualizan los datos de estas variables. Consideremos, a manera de ejemplo, la altura media de los habitantes en tres ciudades diferentes.

Boxplot o diagramas de caja

Este gráfico nos señala la distribución de una variable mediante cuartiles y nos ayuda a examinar cómo se distribuye una variable para diferentes grupos.

Histograma

Este gráfico nos señala la distribución de datos numéricos mediante barras, donde cada barra indica la frecuencia de datos en un rango especifico.

Diagrama de dispersión

Este gráfico nos señala la relación entre dos variables continuas mediante puntos.

Existen diversas librerías para ambos lenguajes que nos ayudan a realizar la visualización de datos, entre las cuales podemos señalar las siguientes:

Ggplot2 en R

Matplotlib en Python

Librería Bokeh en Python

Por ulitmo, R cuenta con diversas funciones para la creación de gráficos, como las ya mencionadas y plot(), la cual es utilizada para generar diversos tipos de visualizaciones. Además, existen funciones para generar gráficos para variables cuantitativas y cualitativas, lo cual te permitirá transformar el big data en información relevante para la toma de decisiones.