4. Resultados mediante PyGWalker


Es una biblioteca de Python para obtener visualizaciones de datos al hacer un análisis exploratorio de los datos del Dataset.

Para hacer uso de la biblioteca PyGwalker es necesario realizar la instalación del paquete en Python:


 




Junto con las librerías base necesarias                             






Haciendo uso del componente grafico de PyGWalker tenemos todas las variables encontradas en el dataset para realizar posibles cruces y análisis entre ellas.



Visualización de Datos con PyGWalker

  • A través de esta biblioteca se puede cambiar el tipo de marca para generar diferentes tipos de gráficos (Líneas, barras, dispersión, entre otros).



  • Comparar diferentes medidas permitiendo establecer una vista concatenada con varias medidas en filas y columnas.
  • Crear una vista de facetas con varias sub-vistas divididas por un valor de dimensión.




  • Ver el conjunto de datos en una tabla y realizar configuraciones de tipos de análisis y tipos semánticos.

 


  • Para cada una de las variables dentro de la pestaña data puedo establecer filtros para realizar acotamientos de la información o segmentar la información a analizar.

 


Conclusiones usando PyGWalker en el Dataset de Diabetes

Realizando cruces entre algunas de las variables del dataset entregado se obtienen resultados como los siguientes al hacer uso de la herramienta PyGWalker:

  • Analizado en el eje X el nivel de glucosa en la sangre, en el eje Y el índice de masa corporal y entre esos factores determinando si presenta o no diabetes se puede establecer mayor tendencia a sufrir de diabetes entre las personas que tienen un nivel de glucosa en la sangre superior a 200 y un índice de masa corporal entre 20 y 60.

  • Analizado en el eje X la edad, en el eje Y el índice de masa corporal y entre esos factores determinando si presenta o no diabetes se puede establecer mayor tendencia a sufrir de diabetes entre las personas mayores a 55 años un índice de masa corporal entre 25 y 60.

  •      Analizado en el eje X el nivel de glucosa en la sangre, en el eje Y el nivel HbA1c y entre esos factores determinando si presenta o no diabetes se puede establecer mayor tendencia a sufrir de diabetes entre las personas con nivel de glucosa en la sangre entre 126 y 160 y un nivel HbA1c entre 5,7 y 9.
 
   

  •  Analizado en el eje X el nivel HbA1c, en el eje Y el género y estableciendo un filtro para positivo para diabetes se obtiene que indistintamente si la persona es hombre o mujer con un rango del nivel HbA1c entre 5,7 y 7,5 las personas tienen diabetes.





Estos son algunos de los resultados que se pueden obtener al hacer uso de la biblioteca PyGWalker y realizar análisis entre las diferentes dimensiones del dataset entregado.


Entradas más populares de este blog

3. Resultados mediante ProfileReport de Pandas