Spark : Le guide définitif : Le traitement des Big Data en toute simplicité

Note :   (4,5 sur 5)

Spark : Le guide définitif : Le traitement des Big Data en toute simplicité (Bill Chambers)

Avis des lecteurs

Résumé:

Le livre sur Apache Spark (principalement axé sur PySpark) a reçu diverses critiques, soulignant son approche pratique, ses explications détaillées et ses nombreux exemples en Scala et en Python. Cependant, il est également critiqué pour son organisation, la précision du code et les problèmes de formatage lorsqu'il est lu sur certains appareils.

Avantages:

Approche d'apprentissage pratique
couverture complète des concepts Spark
exemples de code détaillés en Scala et Python
inclut des sections ML
matériel organisé pour comprendre l'architecture Spark
bon pour les apprenants en transition depuis d'autres langages de programmation
utile en tant que source unique pour Spark en production.

Inconvénients:

Certains exemples de code sont incorrects ou doivent être modifiés
l'organisation peut être hachée
problèmes de formatage sur les plates-formes numériques (par exemple, Kindle)
les pages peuvent être de mauvaise qualité d'impression
certains le trouvent répétitif
peut ne pas fournir des connaissances immédiatement exploitables pour tous les lecteurs.

(basé sur 71 avis de lecteurs)

Titre original :

Spark: The Definitive Guide: Big Data Processing Made Simple

Contenu du livre :

Apprenez à utiliser, déployer et maintenir Apache Spark grâce à ce guide complet, écrit par les créateurs de ce framework de cluster computing open-source. En mettant l'accent sur les améliorations et les nouvelles fonctionnalités de Spark 2. 0, les auteurs Bill Chambers et Matei Zaharia divisent les sujets relatifs à Spark en sections distinctes, chacune ayant des objectifs uniques.

Vous explorerez les opérations de base et les fonctions communes des API structurées de Spark, ainsi que le Streaming structuré, une nouvelle API de haut niveau pour construire des applications de streaming de bout en bout. Les développeurs et les administrateurs système apprendront les principes fondamentaux de la surveillance, du réglage et du débogage de Spark, et exploreront les techniques d'apprentissage automatique et les scénarios d'utilisation de MLlib, la bibliothèque d'apprentissage automatique évolutive de Spark.

⬤ Vous obtiendrez une vue d'ensemble du big data et de Spark.

⬤ Apprendre à connaître les DataFrames, SQL et Datasets - les API de base de Spark - à l'aide d'exemples pratiques.

⬤ Plonger dans les API de bas niveau de Spark, les RDD, et l'exécution de SQL et de DataFrames.

⬤ Comprendre comment Spark fonctionne sur un cluster.

⬤ Déboguer, surveiller et régler les clusters et les applications Spark.

⬤ Apprendre la puissance de Spark Structured Streaming et MLlib pour les tâches d'apprentissage automatique.

⬤ Explorer l'écosystème Spark au sens large, y compris SparkR et Graph Analysis.

⬤ Examiner le déploiement de Spark, y compris la couverture de Spark dans le Cloud.

Autres informations sur le livre :

ISBN :9781491912218
Auteur :
Éditeur :
Reliure :Broché
Année de publication :2018
Nombre de pages :606

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Spark : Le guide définitif : Le traitement des Big Data en toute simplicité - Spark: The Definitive...
Apprenez à utiliser, déployer et maintenir Apache...
Spark : Le guide définitif : Le traitement des Big Data en toute simplicité - Spark: The Definitive Guide: Big Data Processing Made Simple

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)