| Número de páginas: |
XVIII, 210 p. 187 ilustraciones, 32 ilustraciones en color. |
| Resumen: |
Aproveche los modelos de aprendizaje profundo y automático para crear aplicaciones a partir de datos en tiempo real utilizando PySpark. Este libro es perfecto para quienes desean aprender a utilizar este lenguaje para realizar análisis de datos exploratorios y resolver una variedad de desafÃos comerciales. Comenzará revisando los fundamentos de PySpark, como la arquitectura central de Spark, y verá cómo usar PySpark para el procesamiento de big data, como técnicas de ingesta, limpieza y transformación de datos. A esto le sigue la creación de flujos de trabajo para analizar datos de transmisión utilizando PySpark y una comparación de varias plataformas de transmisión. Luego, verá cómo programar diferentes trabajos de Spark usando Airflow con PySpark y examinará la máquina de ajuste y los modelos de aprendizaje profundo para obtener predicciones en tiempo real. Este libro concluye con una discusión sobre marcos de gráficos y la realización de análisis de redes utilizando algoritmos de gráficos en PySpark. Todo el código presentado en el libro estará disponible en scripts de Python en Github. |