admin

Dominando gráficos en Python con Matplotlib y Seaborn

Matplotlib y Seaborn son las bibliotecas más utilizadas en Python para la visualización de datos. Si no conoces las funciones que ofrecen estas bibliotecas pues este tutorial es para ti.
Este artículo te guiará en los principales gráficos para realizar un buen análisis visual de presentación de resultados.

Seguir leyendo…

GUÍA SOBRE TÉCNICAS DE IMPUTACIÓN DE DATOS CON PYTHON

Las personas que trabajan en el campo de la ciencia de datos comprenden la importancia de los datos. La mayoría de los algoritmos de Machine Learning esperan conjuntos de datos completos y limpios sin ningún tipo de ruido o perturbación; desafortunadamente, los conjuntos de datos del mundo real son desordenados, se encuentran en diferentes escalas de medición y siempre existen los conocidos valores faltantes, es por ello que el manejo de datos faltantes se vuelve muy importante para realizar un correcto análisis como científicos de datos.

Seguir leyendo…

Análisis clúster: preprocesamiento, creación y comparación de metodologías

Este artículo lo guiará a través de todo el proceso de segmentación, desde el entendimiento de los datos, pasando por las buenas prácticas recomendadas para una correcta programación, el análisis exploratorio inicial, las transformaciones más adecuadas previas a la segmentación, así como la generación, análisis y visualización de los segmentos obtenidos mediante la exploración de características.

Seguir leyendo…

Los mejores 13 libros de ciencia de datos que debe leer, según los expertos

La ciencia de los datos –la amalgama de las matemáticas, la estadística, las disciplinas informáticas, el aprendizaje automático, el análisis de clusters, la minería de datos y la visualización– ya no es solo el ámbito de los científicos de datos. No es de extrañar, por tanto, que se haya convertido en un tema popular entre los líderes empresariales, economistas, antropólogos y otros. Dicho esto, aquellos que están bien afianzados en los entresijos de la ciencia de los datos pueden encontrar una avalancha de nuevos títulos en el mercado. He aquí un pequeño compendio de algunos de los mejores.