GALAR, MIKEL / TRIGUERO, ISAAC
Prefacio
Parte I: Entender y trabajar con big data
Capítulo 1. Introducción
Capítulo 2. MapReduce
Parte II. Plataformas de big data
Capítulo 3. Hadoop
Capítulo 4. Spark
Capítulo 5. Spark SQL y DataFrames
Parte III: Aprendizaje automático con big data
Capítulo 6. Aprendizaje automático en Spark
Capítulo 7. Diseño de algoritmos de machine learning para big data
Capítulo 8. Implementación de modelos clásicos: k-medias y regresión lineal
Capítulo 9. Ejemplos avanzados: Aprendizaje semi-supervisado, ensembles, y despliegue de modelos de deep learning
Bibliografía
Índice alfabético
El análisis de datos a gran escala es clave para construir modelos de inteligencia artificial. Aprenda, con un enfoque práctico, a diseñar modelos de machine learning a gran escala con Python y Spark.El procesamiento y análisis de datos en inteligencia artificial requiere plataformas distribuidas capaces de gestionar grandes volúmenes de información. Esta guía práctica ofrece los conceptos clave y las habilidades necesarias para abordar tareas de análisis de datos y aprendizaje automático a gran escala. «Con la creciente disponibilidad de conjuntos de datos grandes y complejos, dominar modelos de programación como MapReduce y Spark se ha convertido en una habilidad imprescindible para científicos de datos, ingenieros de datos y especialistas en machine learning. Triguero y Galar aprovechan su amplia experiencia docente en este ámbito para ofrecer una obra rigurosa y accesible que aborda tanto los conceptos técnicos como las habilidades prácticas necesarias para el análisis de datos a gran escala. Alternan explicaciones claras e intuitivas con ejemplos relevantes de ingeniería de datos y pipelines clásicos de