| Título : |
Beginning Apache Spark Using Azure Databricks : Unleashing Large Cluster Analytics in the Cloud |
| Tipo de documento: |
documento electrónico |
| Autores: |
Ilijason, Robert, Autor |
| Mención de edición: |
1 ed. |
| Editorial: |
Berkeley, CA : Apress |
| Fecha de publicación: |
2020 |
| Número de páginas: |
XVII, 274 p. 14 ilustraciones |
| ISBN/ISSN/DL: |
978-1-4842-5781-4 |
| Nota general: |
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos. |
| Palabras clave: |
Investigación cuantitativa programas de microsoft NET Framework microsoft Software de código abierto Análisis de datos y Big Data microsoft Fuente abierta |
| Índice Dewey: |
1.422 |
| Resumen: |
Analice grandes cantidades de datos en un tiempo récord utilizando Apache Spark con Databricks en la nube. Conozca los fundamentos, y más, de la ejecución de análisis en clústeres grandes en Azure y AWS, utilizando Apache Spark con Databricks encima. Descubra cómo aprovechar al máximo sus datos por una mera fracción de lo que cuestan las soluciones analíticas clásicas y, al mismo tiempo, obtener los resultados que necesita, cada vez más rápido. Este libro explica cómo la confluencia de estas tecnologías fundamentales le brinda un poder enorme y económico cuando se trata de conjuntos de datos enormes. Comenzará aprendiendo cómo la infraestructura en la nube permite escalar su código a grandes cantidades de unidades de procesamiento, sin tener que pagar por la maquinaria por adelantado. A partir de ahí, aprenderá cómo Apache Spark, un marco de código abierto, puede habilitar todas esas CPU para el uso de análisis de datos. Finalmente, verás cómo servicios como Databricks aportan la potencia de Apache Spark, sin que tengas que saber nada de configuración de hardware o software. Al eliminar la necesidad de costosos expertos y hardware, sus recursos pueden asignarse a encontrar valor comercial en los datos. Este libro lo guía a través de algunos temas avanzados, como análisis en la nube, lagos de datos, ingesta de datos, arquitectura, aprendizaje automático y herramientas, incluidos Apache Spark, Apache Hadoop, Apache Hive, Python y SQL. Los valiosos ejercicios ayudan a reforzar lo aprendido. Lo que aprenderá Descubra el valor del análisis de big data que aprovecha el poder de la nube. Comience con Databricks usando SQL y Python en Microsoft Azure o AWS. Comprenda la tecnología subyacente y cómo la nube y Spark encajan en el panorama general. Vea cómo. estas herramientas se utilizan en el mundo real. Ejecute análisis básicos, incluido el aprendizaje automático, en miles de millones de filas por una fracción del costo o de forma gratuita. Este libro está dirigido a ingenieros de datos, científicos de datos y arquitectos de la nube que desean o necesitan ejecutar análisis avanzados en la nube. Se supone que el lector tiene experiencia con los datos, pero quizás una exposición mínima a Apache Spark y Azure Databricks. El libro también se recomienda para personas que quieran iniciarse en el campo de la analítica, ya que proporciona una base sólida. Robert Ilijason es un veterano con 20 años de experiencia en el segmento de inteligencia empresarial (BI). Ha trabajado como contratista para algunas de las empresas más grandes de Europa y ha llevado a cabo proyectos de análisis a gran escala en las áreas de comercio minorista, telecomunicaciones, banca, gobierno y más. Robert ha visto su parte de tendencias analíticas ir y venir a lo largo de los años, pero a diferencia de la mayoría de ellas, cree firmemente que Apache Spark en la nube, especialmente con Azure Databricks, cambia las reglas del juego. |
| Nota de contenido: |
Chapter 1: Introduction to Large-Scale Data Analytics -- Chapter 2: Spark and Databricks -- Chapter 3: Getting Started with Databricks -- Chapter 4: Workspaces, Clusters, and Notebooks -- Chapter 5: Getting Data into Databricks -- Chapter 6: Querying Data Using SQL -- Chapter 7: The Power of Python -- Chapter 8: ETL and Advanced Data Wrangling -- Chapter 9: Connecting to and from Afar -- Chapter 10: Running in Production -- Chapter 11: Bits and Pieces. |
| En línea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
Beginning Apache Spark Using Azure Databricks : Unleashing Large Cluster Analytics in the Cloud [documento electrónico] / Ilijason, Robert, Autor . - 1 ed. . - Berkeley, CA : Apress, 2020 . - XVII, 274 p. 14 ilustraciones. ISBN : 978-1-4842-5781-4 Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
| Palabras clave: |
Investigación cuantitativa programas de microsoft NET Framework microsoft Software de código abierto Análisis de datos y Big Data microsoft Fuente abierta |
| Índice Dewey: |
1.422 |
| Resumen: |
Analice grandes cantidades de datos en un tiempo récord utilizando Apache Spark con Databricks en la nube. Conozca los fundamentos, y más, de la ejecución de análisis en clústeres grandes en Azure y AWS, utilizando Apache Spark con Databricks encima. Descubra cómo aprovechar al máximo sus datos por una mera fracción de lo que cuestan las soluciones analíticas clásicas y, al mismo tiempo, obtener los resultados que necesita, cada vez más rápido. Este libro explica cómo la confluencia de estas tecnologías fundamentales le brinda un poder enorme y económico cuando se trata de conjuntos de datos enormes. Comenzará aprendiendo cómo la infraestructura en la nube permite escalar su código a grandes cantidades de unidades de procesamiento, sin tener que pagar por la maquinaria por adelantado. A partir de ahí, aprenderá cómo Apache Spark, un marco de código abierto, puede habilitar todas esas CPU para el uso de análisis de datos. Finalmente, verás cómo servicios como Databricks aportan la potencia de Apache Spark, sin que tengas que saber nada de configuración de hardware o software. Al eliminar la necesidad de costosos expertos y hardware, sus recursos pueden asignarse a encontrar valor comercial en los datos. Este libro lo guía a través de algunos temas avanzados, como análisis en la nube, lagos de datos, ingesta de datos, arquitectura, aprendizaje automático y herramientas, incluidos Apache Spark, Apache Hadoop, Apache Hive, Python y SQL. Los valiosos ejercicios ayudan a reforzar lo aprendido. Lo que aprenderá Descubra el valor del análisis de big data que aprovecha el poder de la nube. Comience con Databricks usando SQL y Python en Microsoft Azure o AWS. Comprenda la tecnología subyacente y cómo la nube y Spark encajan en el panorama general. Vea cómo. estas herramientas se utilizan en el mundo real. Ejecute análisis básicos, incluido el aprendizaje automático, en miles de millones de filas por una fracción del costo o de forma gratuita. Este libro está dirigido a ingenieros de datos, científicos de datos y arquitectos de la nube que desean o necesitan ejecutar análisis avanzados en la nube. Se supone que el lector tiene experiencia con los datos, pero quizás una exposición mínima a Apache Spark y Azure Databricks. El libro también se recomienda para personas que quieran iniciarse en el campo de la analítica, ya que proporciona una base sólida. Robert Ilijason es un veterano con 20 años de experiencia en el segmento de inteligencia empresarial (BI). Ha trabajado como contratista para algunas de las empresas más grandes de Europa y ha llevado a cabo proyectos de análisis a gran escala en las áreas de comercio minorista, telecomunicaciones, banca, gobierno y más. Robert ha visto su parte de tendencias analíticas ir y venir a lo largo de los años, pero a diferencia de la mayoría de ellas, cree firmemente que Apache Spark en la nube, especialmente con Azure Databricks, cambia las reglas del juego. |
| Nota de contenido: |
Chapter 1: Introduction to Large-Scale Data Analytics -- Chapter 2: Spark and Databricks -- Chapter 3: Getting Started with Databricks -- Chapter 4: Workspaces, Clusters, and Notebooks -- Chapter 5: Getting Data into Databricks -- Chapter 6: Querying Data Using SQL -- Chapter 7: The Power of Python -- Chapter 8: ETL and Advanced Data Wrangling -- Chapter 9: Connecting to and from Afar -- Chapter 10: Running in Production -- Chapter 11: Bits and Pieces. |
| En línea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
|  |