Entradas

1. Visualización de datos

Imagen
La visualización de datos en el contexto de la Inteligencia de Negocios se refiere a la representación gráfica de datos e información, esta implica el uso de diferentes elementos visuales como cuadros, gráficos y mapas para comunicar información compleja en un formato sencillo y fácil de entender, básicamente el objetivo principal es ayudar a los usuarios empresariales, educativos y en general, todo interesado en tomar decisiones basadas en datos a comprender y analizar rápidamente grandes cantidades de datos, permitiéndoles tomar decisiones informadas con conocimiento de causa. En la era del Big Data, la mayoría de las organizaciones generan grandes volúmenes de datos, pero estos, por sí solos, no pueden proporcionar información útil, la visualización de datos ayuda a las empresas a comprender y aprovechar el valor de sus datos proporcionando una imagen clara de lo que está sucediendo, al igual, desempeña un papel muy importante a la hora de hacer que los datos sean más accesibles, co...

2. Entrando en Materia

Imagen
  Entrando en materia Después de conocer gran parte de las ventajas de trabajar con Python y sus propiedades en cuanto a análisis y visualización de datos se refiere, haremos el desarrollo de un ejercicio con una muestra de 100.000 registros con información de pacientes con alguna afinidad hacia la diabetes, para lo cual, utilizaremos diferentes herramientas que a lo largo de esta entrada iremos describiendo.     Para el ejercicio utilizaremos Google Colab, la cual es una herramienta fácil e intuitiva de manejar, no necesitamos realizar instalación alguna, solo efectuar la búsqueda en el explorador y tener una cuenta Gmail. Cabe resaltar que todas las ejecuciones, también son compatibles con otros motores como Visual estudio code, Jupiter entre muchas. Las diferentes ventajas de Google Colab, es que no requiere configuración, el uso de las CPU no tiene costo y permite compartir contenido fácilmente. Resaltando que Python es muy versátil, utilizaremos archivos que con...

3. Resultados mediante ProfileReport de Pandas

Imagen
Pandas-profiling o ProfileReport de Pandas, es una biblioteca de Python que permite generar informes HTML interactivos basados en DataSet, utilizando estos informes se puede: Explorar los datos:  aprovechando la vista completa de la distribución de los datos, incluyendo estadísticas descriptivas, histogramas, gráficos de dispersión y correlogramas. Identificar patrones y anomalías:  muestra los diferentes valores atípicos, valores perdidos y correlaciones interesantes en los datos. Limpiar y preparar los datos:  detecta automáticamente tipos de datos incorrectos, valores faltantes y valores inconsistentes y ayuda a corregirlos. Comprender mejor los datos:  ofrece una mejor comprensión de la estructura, el contenido y las relaciones entre las variables del DataSet analizado. Esta herramienta ayuda mucho en el análisis y diagnóstico de una base de datos, mediante los informes automáticos se puede: Acelerar los análisis de datos:  permite un ahorro de tiempo e...

4. Resultados mediante PyGWalker

Imagen
Es una biblioteca de Python para obtener visualizaciones de datos al hacer un análisis exploratorio de los datos del Dataset. Para hacer uso de la biblioteca PyGwalker es necesario realizar la instalación del paquete en Python:   Junto con las librerías base necesarias                               Haciendo uso del componente grafico de PyGWalker tenemos todas las variables encontradas en el dataset para realizar posibles cruces y análisis entre ellas. Visualización de Datos con PyGWalker A través de esta biblioteca se puede cambiar el tipo de marca para generar diferentes tipos de gráficos (Líneas, barras, dispersión, entre otros). Comparar diferentes medidas permitiendo establecer una vista concatenada con varias medidas en filas y columnas. Crear una vista de facetas con varias sub-vistas divididas por un valor de dimensión. Ver el conjunto de datos en una tabla y realizar configuraciones de tip...