| TÃtulo : |
Applied Data Science Using PySpark : Learn the End-to-End Predictive Model-Building Cycle |
| Tipo de documento: |
documento electrónico |
| Autores: |
Kakarla, Ramcharan, Autor ; Krishnan, Sundar, Autor ; Alla, Sridhar, Autor |
| Mención de edición: |
1 ed. |
| Editorial: |
Berkeley, CA : Apress |
| Fecha de publicación: |
2021 |
| Número de páginas: |
XXVI, 410 p. 190 ilustraciones |
| ISBN/ISSN/DL: |
978-1-4842-6500-0 |
| Nota general: |
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos. |
| Palabras clave: |
Lenguajes de programación (computadoras electrónicas) Grandes datos Aprendizaje automático Lenguaje de programación |
| Ãndice Dewey: |
005.13 Lenguajes de programación |
| Resumen: |
Descubra las capacidades de PySpark y su aplicación en el ámbito de la ciencia de datos. Esta guÃa completa con ejemplos cuidadosamente seleccionados de casos de uso diarios lo guiará a través del ciclo de creación de modelos predictivos de extremo a extremo con las últimas técnicas y trucos del oficio. La ciencia de datos aplicada con PySpark se divide en seis secciones que lo guiarán a lo largo del libro. En la sección 1, comenzará con los conceptos básicos de PySpark centrándose en la manipulación de datos. Lo hacemos sentir cómodo con el lenguaje y luego lo aprovechamos para presentarle las funciones matemáticas disponibles en el mercado. En la sección 2, se sumergirá en el arte de la selección de variables donde demostramos varias técnicas de selección disponibles en PySpark. En la sección 3, lo llevamos en un viaje a través de algoritmos, implementaciones y técnicas de ajuste de aprendizaje automático. También hablaremos sobre diferentes métricas de validación y cómo usarlas para elegir los mejores modelos. Las secciones 4 y 5 analizan los procesos de aprendizaje automático y varios métodos disponibles para poner en funcionamiento el modelo y servirlo a través de Docker/una API. En la sección final, cubrirá objetos reutilizables para facilitar la experimentación y aprenderá algunos trucos que pueden ayudarlo a optimizar sus programas y canales de aprendizaje automático. Al final de este libro, habrá visto la flexibilidad y las ventajas de PySpark en aplicaciones de ciencia de datos. Este libro se recomienda a quienes quieran liberar el poder de la computación paralela trabajando simultáneamente con grandes conjuntos de datos. Usted podrá: Construir un modelo predictivo de extremo a extremo Implementar múltiples técnicas de selección de variables Operar modelos Dominar múltiples algoritmos e implementaciones. |
| Nota de contenido: |
Chapter 1: Setting up the Pyspark Environment -- Chapter 2: Basic Statistics and Visualizations -- Chapter 3: :Variable Selection -- Chapter 4: Introduction to different supervised machine algorithms, implementations & Fine-tuning techniques -- Chapter 5: Model Validation and selecting the best model -- Chapter 6: Unsupervised and recommendation algorithms -- Chapter 7:End to end modeling pipelines -- Chapter 8: Productionalizing a machine learning model -- Chapter 9: Experimentations -- Chapter 10:Other Tips: Optional. |
| En lÃnea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
Applied Data Science Using PySpark : Learn the End-to-End Predictive Model-Building Cycle [documento electrónico] / Kakarla, Ramcharan, Autor ; Krishnan, Sundar, Autor ; Alla, Sridhar, Autor . - 1 ed. . - Berkeley, CA : Apress, 2021 . - XXVI, 410 p. 190 ilustraciones. ISBN : 978-1-4842-6500-0 Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
| Palabras clave: |
Lenguajes de programación (computadoras electrónicas) Grandes datos Aprendizaje automático Lenguaje de programación |
| Ãndice Dewey: |
005.13 Lenguajes de programación |
| Resumen: |
Descubra las capacidades de PySpark y su aplicación en el ámbito de la ciencia de datos. Esta guÃa completa con ejemplos cuidadosamente seleccionados de casos de uso diarios lo guiará a través del ciclo de creación de modelos predictivos de extremo a extremo con las últimas técnicas y trucos del oficio. La ciencia de datos aplicada con PySpark se divide en seis secciones que lo guiarán a lo largo del libro. En la sección 1, comenzará con los conceptos básicos de PySpark centrándose en la manipulación de datos. Lo hacemos sentir cómodo con el lenguaje y luego lo aprovechamos para presentarle las funciones matemáticas disponibles en el mercado. En la sección 2, se sumergirá en el arte de la selección de variables donde demostramos varias técnicas de selección disponibles en PySpark. En la sección 3, lo llevamos en un viaje a través de algoritmos, implementaciones y técnicas de ajuste de aprendizaje automático. También hablaremos sobre diferentes métricas de validación y cómo usarlas para elegir los mejores modelos. Las secciones 4 y 5 analizan los procesos de aprendizaje automático y varios métodos disponibles para poner en funcionamiento el modelo y servirlo a través de Docker/una API. En la sección final, cubrirá objetos reutilizables para facilitar la experimentación y aprenderá algunos trucos que pueden ayudarlo a optimizar sus programas y canales de aprendizaje automático. Al final de este libro, habrá visto la flexibilidad y las ventajas de PySpark en aplicaciones de ciencia de datos. Este libro se recomienda a quienes quieran liberar el poder de la computación paralela trabajando simultáneamente con grandes conjuntos de datos. Usted podrá: Construir un modelo predictivo de extremo a extremo Implementar múltiples técnicas de selección de variables Operar modelos Dominar múltiples algoritmos e implementaciones. |
| Nota de contenido: |
Chapter 1: Setting up the Pyspark Environment -- Chapter 2: Basic Statistics and Visualizations -- Chapter 3: :Variable Selection -- Chapter 4: Introduction to different supervised machine algorithms, implementations & Fine-tuning techniques -- Chapter 5: Model Validation and selecting the best model -- Chapter 6: Unsupervised and recommendation algorithms -- Chapter 7:End to end modeling pipelines -- Chapter 8: Productionalizing a machine learning model -- Chapter 9: Experimentations -- Chapter 10:Other Tips: Optional. |
| En lÃnea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
|  |