ciencia de datos

Dominando gráficos en Python con Matplotlib y Seaborn

Matplotlib y Seaborn son las bibliotecas más utilizadas en Python para la visualización de datos. Si no conoces las funciones que ofrecen estas bibliotecas pues este tutorial es para ti.
Este artículo te guiará en los principales gráficos para realizar un buen análisis visual de presentación de resultados.

Seguir leyendo…

GUÍA SOBRE TÉCNICAS DE IMPUTACIÓN DE DATOS CON PYTHON

Las personas que trabajan en el campo de la ciencia de datos comprenden la importancia de los datos. La mayoría de los algoritmos de Machine Learning esperan conjuntos de datos completos y limpios sin ningún tipo de ruido o perturbación; desafortunadamente, los conjuntos de datos del mundo real son desordenados, se encuentran en diferentes escalas de medición y siempre existen los conocidos valores faltantes, es por ello que el manejo de datos faltantes se vuelve muy importante para realizar un correcto análisis como científicos de datos.

Seguir leyendo…

Análisis clúster: preprocesamiento, creación y comparación de metodologías

Este artículo lo guiará a través de todo el proceso de segmentación, desde el entendimiento de los datos, pasando por las buenas prácticas recomendadas para una correcta programación, el análisis exploratorio inicial, las transformaciones más adecuadas previas a la segmentación, así como la generación, análisis y visualización de los segmentos obtenidos mediante la exploración de características.

Seguir leyendo…