Catálogo Biblioteca Universidad de Manizales

Información del autor

Autor Kakarla, Ramcharan

Documentos disponibles escritos por este autor (1)

Crear una solicitud de compra Refinar búsqueda

Applied Data Science Using PySpark / Kakarla, Ramcharan

Público

ISBD

Ningún comentario para este registro.

Título : Applied Data Science Using PySpark : Learn the End-to-End Predictive Model-Building Cycle
Tipo de documento: documento electrónico
Autores: Kakarla, Ramcharan, ; Krishnan, Sundar, ; Alla, Sridhar,
Mención de edición: 1 ed.
Editorial: Berkeley, CA : Apress
Fecha de publicación: 2021
Número de páginas: XXVI, 410 p. 190 ilustraciones
ISBN/ISSN/DL: 978-1-4842-6500-0
Nota general: Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
Idioma : Inglés (eng)
Palabras clave: Lenguajes de programación (computadoras electrónicas) Grandes datos Aprendizaje automático Lenguaje de programación
Clasificación: 005.13
Resumen: Descubra las capacidades de PySpark y su aplicación en el ámbito de la ciencia de datos. Esta guía completa con ejemplos cuidadosamente seleccionados de casos de uso diarios lo guiará a través del ciclo de creación de modelos predictivos de extremo a extremo con las últimas técnicas y trucos del oficio. La ciencia de datos aplicada con PySpark se divide en seis secciones que lo guiarán a lo largo del libro. En la sección 1, comenzará con los conceptos básicos de PySpark centrándose en la manipulación de datos. Lo hacemos sentir cómodo con el lenguaje y luego lo aprovechamos para presentarle las funciones matemáticas disponibles en el mercado. En la sección 2, se sumergirá en el arte de la selección de variables donde demostramos varias técnicas de selección disponibles en PySpark. En la sección 3, lo llevamos en un viaje a través de algoritmos, implementaciones y técnicas de ajuste de aprendizaje automático. También hablaremos sobre diferentes métricas de validación y cómo usarlas para elegir los mejores modelos. Las secciones 4 y 5 analizan los procesos de aprendizaje automático y varios métodos disponibles para poner en funcionamiento el modelo y servirlo a través de Docker/una API. En la sección final, cubrirá objetos reutilizables para facilitar la experimentación y aprenderá algunos trucos que pueden ayudarlo a optimizar sus programas y canales de aprendizaje automático. Al final de este libro, habrá visto la flexibilidad y las ventajas de PySpark en aplicaciones de ciencia de datos. Este libro se recomienda a quienes quieran liberar el poder de la computación paralela trabajando simultáneamente con grandes conjuntos de datos. Usted podrá: Construir un modelo predictivo de extremo a extremo Implementar múltiples técnicas de selección de variables Operar modelos Dominar múltiples algoritmos e implementaciones.
Nota de contenido: Chapter 1: Setting up the Pyspark Environment -- Chapter 2: Basic Statistics and Visualizations -- Chapter 3: :Variable Selection -- Chapter 4: Introduction to different supervised machine algorithms, implementations & Fine-tuning techniques -- Chapter 5: Model Validation and selecting the best model -- Chapter 6: Unsupervised and recommendation algorithms -- Chapter 7:End to end modeling pipelines -- Chapter 8: Productionalizing a machine learning model -- Chapter 9: Experimentations -- Chapter 10:Other Tips: Optional.
Tipo de medio : Computadora
Summary : Discover the capabilities of PySpark and its application in the realm of data science. This comprehensive guide with hand-picked examples of daily use cases will walk you through the end-to-end predictive model-building cycle with the latest techniques and tricks of the trade. Applied Data Science Using PySpark is divided unto six sections which walk you through the book. In section 1, you start with the basics of PySpark focusing on data manipulation. We make you comfortable with the language and then build upon it to introduce you to the mathematical functions available off the shelf. In section 2, you will dive into the art of variable selection where we demonstrate various selection techniques available in PySpark. In section 3, we take you on a journey through machine learning algorithms, implementations, and fine-tuning techniques. We will also talk about different validation metrics and how to use them for picking the best models. Sections 4 and 5 go through machine learning pipelines and various methods available to operationalize the model and serve it through Docker/an API. In the final section, you will cover reusable objects for easy experimentation and learn some tricks that can help you optimize your programs and machine learning pipelines. By the end of this book, you will have seen the flexibility and advantages of PySpark in data science applications. This book is recommended to those who want to unleash the power of parallel computing by simultaneously working with big datasets. You will: Build an end-to-end predictive model Implement multiple variable selection techniques Operationalize models Master multiple algorithms and implementations .
Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...]

Applied Data Science Using PySpark : Learn the End-to-End Predictive Model-Building Cycle [documento electrónico] / Kakarla, Ramcharan, ; Krishnan, Sundar, ; Alla, Sridhar, . - 1 ed. . - Berkeley, CA : Apress, 2021 . - XXVI, 410 p. 190 ilustraciones.
ISBN : 978-1-4842-6500-0
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
Idioma : Inglés (eng)
Palabras clave: Lenguajes de programación (computadoras electrónicas) Grandes datos Aprendizaje automático Lenguaje de programación
Clasificación: 005.13
Resumen: Descubra las capacidades de PySpark y su aplicación en el ámbito de la ciencia de datos. Esta guía completa con ejemplos cuidadosamente seleccionados de casos de uso diarios lo guiará a través del ciclo de creación de modelos predictivos de extremo a extremo con las últimas técnicas y trucos del oficio. La ciencia de datos aplicada con PySpark se divide en seis secciones que lo guiarán a lo largo del libro. En la sección 1, comenzará con los conceptos básicos de PySpark centrándose en la manipulación de datos. Lo hacemos sentir cómodo con el lenguaje y luego lo aprovechamos para presentarle las funciones matemáticas disponibles en el mercado. En la sección 2, se sumergirá en el arte de la selección de variables donde demostramos varias técnicas de selección disponibles en PySpark. En la sección 3, lo llevamos en un viaje a través de algoritmos, implementaciones y técnicas de ajuste de aprendizaje automático. También hablaremos sobre diferentes métricas de validación y cómo usarlas para elegir los mejores modelos. Las secciones 4 y 5 analizan los procesos de aprendizaje automático y varios métodos disponibles para poner en funcionamiento el modelo y servirlo a través de Docker/una API. En la sección final, cubrirá objetos reutilizables para facilitar la experimentación y aprenderá algunos trucos que pueden ayudarlo a optimizar sus programas y canales de aprendizaje automático. Al final de este libro, habrá visto la flexibilidad y las ventajas de PySpark en aplicaciones de ciencia de datos. Este libro se recomienda a quienes quieran liberar el poder de la computación paralela trabajando simultáneamente con grandes conjuntos de datos. Usted podrá: Construir un modelo predictivo de extremo a extremo Implementar múltiples técnicas de selección de variables Operar modelos Dominar múltiples algoritmos e implementaciones.
Nota de contenido: Chapter 1: Setting up the Pyspark Environment -- Chapter 2: Basic Statistics and Visualizations -- Chapter 3: :Variable Selection -- Chapter 4: Introduction to different supervised machine algorithms, implementations & Fine-tuning techniques -- Chapter 5: Model Validation and selecting the best model -- Chapter 6: Unsupervised and recommendation algorithms -- Chapter 7:End to end modeling pipelines -- Chapter 8: Productionalizing a machine learning model -- Chapter 9: Experimentations -- Chapter 10:Other Tips: Optional.
Tipo de medio : Computadora
Summary : Discover the capabilities of PySpark and its application in the realm of data science. This comprehensive guide with hand-picked examples of daily use cases will walk you through the end-to-end predictive model-building cycle with the latest techniques and tricks of the trade. Applied Data Science Using PySpark is divided unto six sections which walk you through the book. In section 1, you start with the basics of PySpark focusing on data manipulation. We make you comfortable with the language and then build upon it to introduce you to the mathematical functions available off the shelf. In section 2, you will dive into the art of variable selection where we demonstrate various selection techniques available in PySpark. In section 3, we take you on a journey through machine learning algorithms, implementations, and fine-tuning techniques. We will also talk about different validation metrics and how to use them for picking the best models. Sections 4 and 5 go through machine learning pipelines and various methods available to operationalize the model and serve it through Docker/an API. In the final section, you will cover reusable objects for easy experimentation and learn some tricks that can help you optimize your programs and machine learning pipelines. By the end of this book, you will have seen the flexibility and advantages of PySpark in data science applications. This book is recommended to those who want to unleash the power of parallel computing by simultaneously working with big datasets. You will: Build an end-to-end predictive model Implement multiple variable selection techniques Operationalize models Master multiple algorithms and implementations .
Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...]