Este libro introduce a aquellos que no son Data Scientists (científicos de datos), ni tienen conocimientos particulares de matemáticas, en la metodología de Machine Learning (Aprendizaje Automático), sus conceptos, sus principales algoritmos y la implementación de estos en Python usando Scikit-learn. Comienza con una presentación del Machine Learning y, a continuación, del método CRISP, sobre el que se aborda cada fase y sus diversas etapas. Los primeros capítulos tratan sobre el Business...
Este libro introduce a aquellos que no son Data Scientists (científicos de datos), ni tienen conocimientos particulares de matemáticas, en la metodología de Machine Learning (Aprendizaje Automático), sus conceptos, sus principales algoritmos y la implementación de estos en Python usando Scikit-learn.
Comienza con una presentación del Machine Learning y, a continuación, del método CRISP, sobre el que se aborda cada fase y sus diversas etapas. Los primeros capítulos tratan sobre el Business Understanding (conocimiento del negocio), la Data Understanding (compresión de los datos) y la Data Preparation (preparación de los datos). Estos capítulos presentan los análisis estadísticos de los conjuntos de datos (datasets) tanto en forma numérica como gráfica, así como las principales técnicas utilizadas para preparar los datos, su función y consejos sobre cómo utilizarlas.
A continuación, se dedican varios capítulos a cada tarea de Machine Learning: la clasificación, la regresión (con el caso especial de la predicción), el clustering (agrupación) y, de forma más general, el aprendizaje no supervisado. Para cada tarea presentada, se detallan sucesivamente los criterios de evaluación, los conceptos en los que se basan los principales algoritmos y su implementación usando Scikit-learn.
Para ilustrar los distintos capítulos, las técnicas y algoritmos presentados se aplican a conjuntos de datos de uso frecuente: Iris (clasificar flores), Boston (prever el precio de venta de pisos) y Titanic (definir la probabilidad de supervivencia de los pasajeros de un barco). El código Python está comentado y puede descargarse (en forma de cuadernos Jupyter) a partir del sitio web www.ediciones-eni.com.
Virginie MATHIVET cursó un doctorado en Inteligencia Artificial, más concretamente en algoritmos genéticos y redes neuronales. Tras impartir clases de inteligencia artificial, robótica y materias relacionadas con el desarrollo durante más de 10 años, creó un departamento de Datos en una ESN (IA, Ingeniería de Datos, Big Data). En 2023 creó su propia empresa, Hemelopse, para centrarse en la consultoría estratégica de IA, al mismo tiempo que sigue formando y entrenando a Científicos de Datos. También es conferencista.