| Título : |
Big Data Processing Using Spark in Cloud |
| Tipo de documento: |
documento electrónico |
| Autores: |
Mittal, Mamta, ; Balas, Valentina E., ; Goyal, Lalit Mohan, ; Kumar, Raghvendra, |
| Mención de edición: |
1 ed. |
| Editorial: |
Singapore [Malasya] : Springer |
| Fecha de publicación: |
2019 |
| Número de páginas: |
XIII, 264 p. 89 ilustraciones, 62 ilustraciones en color. |
| ISBN/ISSN/DL: |
978-981-1305504-- |
| Nota general: |
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos. |
| Palabras clave: |
Grandes datos Protección de datos Investigación cuantitativa Seguridad de datos e información Análisis de datos y Big Data |
| Índice Dewey: |
005.7 Datos en sistemas de computadoras |
| Resumen: |
El libro describe el surgimiento de las tecnologías de big data y el papel de Spark en toda la pila de big data. Compara Spark y Hadoop e identifica las deficiencias de Hadoop que Spark ha superado. El libro se centra principalmente en la arquitectura en profundidad de Spark y nuestra comprensión de los RDD de Spark y cómo RDD complementa la naturaleza inmutable de big data y lo resuelve con evaluación diferida, almacenamiento en caché e inferencia de tipos. También aborda temas avanzados en Spark, comenzando con los conceptos básicos de Scala y el marco central de Spark, y explorando los marcos de datos de Spark, el aprendizaje automático usando Mllib, el análisis de gráficos usando Graph X y el procesamiento en tiempo real con Apache Kafka, AWS Kenisis y Azure. Centro de eventos. Luego continúa investigando Spark usando PySpark y R. Centrándose en la pila de big data actual, el libro examina la interacción con las herramientas de big data actuales, siendo Spark la capa de procesamiento central para todo tipo de datos. El libro está dirigido a ingenieros y científicos de datos que trabajan con conjuntos de datos masivos y tecnologías de big data en la nube. Además de para los profesionales de la industria, es útil para los aspirantes a profesionales del procesamiento de datos y para los estudiantes que trabajan en entornos de procesamiento de big data y computación en la nube. |
| Nota de contenido: |
Concepts of Big Data and Apache Spark -- Big Data Analysis in Cloud and Machine Learning -- Security Issues and Challenges related to Big Data -- Big Data Security Solutions in Cloud -- Data Science and Analytics -- Big Data Technologies -- Data Analysis with Casandra and Spark -- Spin up the Spark Cluster -- Learn Scala -- IO for Spark -- Processing with Spark -- Spark Data Frames and Spark SQL -- Machine Learning and Advanced Analytics -- Parallel Programming with Spark -- Distributed Graph Processing with Spark -- Real Time Processing with Spark -- Spark in Real World -- Case Studies. . |
| En línea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
Big Data Processing Using Spark in Cloud [documento electrónico] / Mittal, Mamta, ; Balas, Valentina E., ; Goyal, Lalit Mohan, ; Kumar, Raghvendra, . - 1 ed. . - Singapore [Malasya] : Springer, 2019 . - XIII, 264 p. 89 ilustraciones, 62 ilustraciones en color. ISBN : 978-981-1305504-- Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
| Palabras clave: |
Grandes datos Protección de datos Investigación cuantitativa Seguridad de datos e información Análisis de datos y Big Data |
| Índice Dewey: |
005.7 Datos en sistemas de computadoras |
| Resumen: |
El libro describe el surgimiento de las tecnologías de big data y el papel de Spark en toda la pila de big data. Compara Spark y Hadoop e identifica las deficiencias de Hadoop que Spark ha superado. El libro se centra principalmente en la arquitectura en profundidad de Spark y nuestra comprensión de los RDD de Spark y cómo RDD complementa la naturaleza inmutable de big data y lo resuelve con evaluación diferida, almacenamiento en caché e inferencia de tipos. También aborda temas avanzados en Spark, comenzando con los conceptos básicos de Scala y el marco central de Spark, y explorando los marcos de datos de Spark, el aprendizaje automático usando Mllib, el análisis de gráficos usando Graph X y el procesamiento en tiempo real con Apache Kafka, AWS Kenisis y Azure. Centro de eventos. Luego continúa investigando Spark usando PySpark y R. Centrándose en la pila de big data actual, el libro examina la interacción con las herramientas de big data actuales, siendo Spark la capa de procesamiento central para todo tipo de datos. El libro está dirigido a ingenieros y científicos de datos que trabajan con conjuntos de datos masivos y tecnologías de big data en la nube. Además de para los profesionales de la industria, es útil para los aspirantes a profesionales del procesamiento de datos y para los estudiantes que trabajan en entornos de procesamiento de big data y computación en la nube. |
| Nota de contenido: |
Concepts of Big Data and Apache Spark -- Big Data Analysis in Cloud and Machine Learning -- Security Issues and Challenges related to Big Data -- Big Data Security Solutions in Cloud -- Data Science and Analytics -- Big Data Technologies -- Data Analysis with Casandra and Spark -- Spin up the Spark Cluster -- Learn Scala -- IO for Spark -- Processing with Spark -- Spark Data Frames and Spark SQL -- Machine Learning and Advanced Analytics -- Parallel Programming with Spark -- Distributed Graph Processing with Spark -- Real Time Processing with Spark -- Spark in Real World -- Case Studies. . |
| En línea: |
https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] |
| Link: |
https://biblioteca.umanizales.edu.co/ils/opac_css/index.php?lvl=notice_display&i |
|  |