Note :
Le livre sur Apache Spark (principalement axé sur PySpark) a reçu diverses critiques, soulignant son approche pratique, ses explications détaillées et ses nombreux exemples en Scala et en Python. Cependant, il est également critiqué pour son organisation, la précision du code et les problèmes de formatage lorsqu'il est lu sur certains appareils.
Avantages:⬤ Approche d'apprentissage pratique
⬤ couverture complète des concepts Spark
⬤ exemples de code détaillés en Scala et Python
⬤ inclut des sections ML
⬤ matériel organisé pour comprendre l'architecture Spark
⬤ bon pour les apprenants en transition depuis d'autres langages de programmation
⬤ utile en tant que source unique pour Spark en production.
⬤ Certains exemples de code sont incorrects ou doivent être modifiés
⬤ l'organisation peut être hachée
⬤ problèmes de formatage sur les plates-formes numériques (par exemple, Kindle)
⬤ les pages peuvent être de mauvaise qualité d'impression
⬤ certains le trouvent répétitif
⬤ peut ne pas fournir des connaissances immédiatement exploitables pour tous les lecteurs.
(basé sur 71 avis de lecteurs)
Spark: The Definitive Guide: Big Data Processing Made Simple
Apprenez à utiliser, déployer et maintenir Apache Spark grâce à ce guide complet, écrit par les créateurs de ce framework de cluster computing open-source. En mettant l'accent sur les améliorations et les nouvelles fonctionnalités de Spark 2. 0, les auteurs Bill Chambers et Matei Zaharia divisent les sujets relatifs à Spark en sections distinctes, chacune ayant des objectifs uniques.
Vous explorerez les opérations de base et les fonctions communes des API structurées de Spark, ainsi que le Streaming structuré, une nouvelle API de haut niveau pour construire des applications de streaming de bout en bout. Les développeurs et les administrateurs système apprendront les principes fondamentaux de la surveillance, du réglage et du débogage de Spark, et exploreront les techniques d'apprentissage automatique et les scénarios d'utilisation de MLlib, la bibliothèque d'apprentissage automatique évolutive de Spark.
⬤ Vous obtiendrez une vue d'ensemble du big data et de Spark.
⬤ Apprendre à connaître les DataFrames, SQL et Datasets - les API de base de Spark - à l'aide d'exemples pratiques.
⬤ Plonger dans les API de bas niveau de Spark, les RDD, et l'exécution de SQL et de DataFrames.
⬤ Comprendre comment Spark fonctionne sur un cluster.
⬤ Déboguer, surveiller et régler les clusters et les applications Spark.
⬤ Apprendre la puissance de Spark Structured Streaming et MLlib pour les tâches d'apprentissage automatique.
⬤ Explorer l'écosystème Spark au sens large, y compris SparkR et Graph Analysis.
⬤ Examiner le déploiement de Spark, y compris la couverture de Spark dans le Cloud.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)