Spark : The Definitive Guide - Maîtriser le traitement des Big Data

Spark : Le guide définitif : Le traitement des Big Data en toute simplicité (Bill Chambers)

Avis des lecteurs

Résumé:

Le livre sur Apache Spark (principalement axé sur PySpark) a reçu diverses critiques, soulignant son approche pratique, ses explications détaillées et ses nombreux exemples en Scala et en Python. Cependant, il est également critiqué pour son organisation, la précision du code et les problèmes de formatage lorsqu'il est lu sur certains appareils.

Avantages:

⬤ Approche d'apprentissage pratique
⬤ couverture complète des concepts Spark
⬤ exemples de code détaillés en Scala et Python
⬤ inclut des sections ML
⬤ matériel organisé pour comprendre l'architecture Spark
⬤ bon pour les apprenants en transition depuis d'autres langages de programmation
⬤ utile en tant que source unique pour Spark en production.

Inconvénients:

⬤ Certains exemples de code sont incorrects ou doivent être modifiés
⬤ l'organisation peut être hachée
⬤ problèmes de formatage sur les plates-formes numériques (par exemple, Kindle)
⬤ les pages peuvent être de mauvaise qualité d'impression
⬤ certains le trouvent répétitif
⬤ peut ne pas fournir des connaissances immédiatement exploitables pour tous les lecteurs.

(basé sur 71 avis de lecteurs)

Titre original :

Spark: The Definitive Guide: Big Data Processing Made Simple

Contenu du livre :

Apprenez à utiliser, déployer et maintenir Apache Spark grâce à ce guide complet, écrit par les créateurs de ce framework de cluster computing open-source. En mettant l'accent sur les améliorations et les nouvelles fonctionnalités de Spark 2. 0, les auteurs Bill Chambers et Matei Zaharia divisent les sujets relatifs à Spark en sections distinctes, chacune ayant des objectifs uniques.

Vous explorerez les opérations de base et les fonctions communes des API structurées de Spark, ainsi que le Streaming structuré, une nouvelle API de haut niveau pour construire des applications de streaming de bout en bout. Les développeurs et les administrateurs système apprendront les principes fondamentaux de la surveillance, du réglage et du débogage de Spark, et exploreront les techniques d'apprentissage automatique et les scénarios d'utilisation de MLlib, la bibliothèque d'apprentissage automatique évolutive de Spark.

⬤ Vous obtiendrez une vue d'ensemble du big data et de Spark.

⬤ Apprendre à connaître les DataFrames, SQL et Datasets - les API de base de Spark - à l'aide d'exemples pratiques.

⬤ Plonger dans les API de bas niveau de Spark, les RDD, et l'exécution de SQL et de DataFrames.

⬤ Comprendre comment Spark fonctionne sur un cluster.

⬤ Déboguer, surveiller et régler les clusters et les applications Spark.

⬤ Apprendre la puissance de Spark Structured Streaming et MLlib pour les tâches d'apprentissage automatique.

⬤ Explorer l'écosystème Spark au sens large, y compris SparkR et Graph Analysis.

⬤ Examiner le déploiement de Spark, y compris la couverture de Spark dans le Cloud.

Autres informations sur le livre :

ISBN :	9781491912218
Auteur :	Bill Chambers
Éditeur :	Oreilly Media
Reliure :	Broché
Année de publication :	2018
Nombre de pages :	606

Achat:

Actuellement disponible, en stock.

Spark : Le guide définitif : Le traitement des Big Data en toute simplicité

Avis des lecteurs

Titre original :

Contenu du livre :

Autres informations sur le livre :

Achat:

Autres livres de l'auteur :

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :