Spark haute performance : Meilleures pratiques pour la mise à l'échelle et l'optimisation d'Apache Spark

Note :   (4,2 sur 5)

Spark haute performance : Meilleures pratiques pour la mise à l'échelle et l'optimisation d'Apache Spark (Holden Karau)

Avis des lecteurs

Résumé:

Le livre « High Performance Spark » propose une exploration détaillée de l'écriture d'un code Spark efficace, adapté aux professionnels ayant une connaissance préalable de Scala et de Spark. Il se concentre sur l'optimisation des performances et fournit des exemples de code complets, principalement en Scala. Alors que certains utilisateurs ont trouvé qu'il s'agissait d'une ressource bien structurée et informative, d'autres ont critiqué son accessibilité pour les débutants et la forte dépendance à l'égard de Scala.

Avantages:

Guide complet sur l'écriture de code Spark haute performance.
Explications détaillées des concepts avancés et des techniques d'optimisation.
Bien structuré avec un bon équilibre entre la théorie et les applications pratiques.
Riche en exemples de code qui améliorent la compréhension, en particulier pour ceux qui sont familiers avec Scala.
Présentation claire, simplicité et diagrammes utiles.

Inconvénients:

Ne convient pas aux débutants ; nécessite une connaissance préalable de Spark et de Scala.
L'accent mis sur Scala peut aliéner les utilisateurs qui ne sont pas familiers avec ce langage.
Certains utilisateurs l'ont trouvé trop dense et trop difficile sans un environnement Spark pratique.
Couverture limitée de certains sujets, tels que le streaming Spark.
Certains l'ont trouvé fastidieux en raison de l'excès d'exemples de codage.

(basé sur 27 avis de lecteurs)

Titre original :

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Contenu du livre :

Apache Spark est extraordinaire lorsque tout se passe bien. Mais si vous n'avez pas vu les améliorations de performance que vous attendiez, ou si vous ne vous sentez pas encore assez confiant pour utiliser Spark en production, ce livre pratique est fait pour vous. Les auteurs Holden Karau et Rachel Warren démontrent des optimisations de performance pour aider vos requêtes Spark à s'exécuter plus rapidement et à traiter des données plus volumineuses, tout en utilisant moins de ressources.

Idéal pour les ingénieurs logiciels, les ingénieurs de données, les développeurs et les administrateurs système qui travaillent avec des applications de données à grande échelle, ce livre décrit des techniques qui peuvent réduire les coûts de l'infrastructure de données et les heures de travail des développeurs. Non seulement vous acquerrez une compréhension plus complète de Spark, mais vous apprendrez également à le faire chanter.

Ce livre vous permettra d'explorer :

⬤ Comment les nouvelles interfaces de Spark SQL améliorent les performances par rapport à la structure de données RDD de SQL.

⬤ Le choix entre les jointures de données dans Core Spark et Spark SQL.

⬤ Les techniques pour tirer le meilleur parti des transformations RDD standard.

⬤ Comment contourner les problèmes de performance dans le paradigme des paires clé/valeur de Spark.

⬤ L'écriture d'un code Spark performant sans Scala ni JVM.

⬤ Comment tester la fonctionnalité et la performance lors de l'application des améliorations suggérées.

⬤ L'utilisation de Spark MLlib et des bibliothèques d'apprentissage machine Spark ML.

⬤ Les composants Streaming de Spark et les packages externes de la communauté.

Autres informations sur le livre :

ISBN :9781491943205
Auteur :
Éditeur :
Reliure :Broché
Année de publication :2017
Nombre de pages :358

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Spark haute performance : Meilleures pratiques pour la mise à l'échelle et l'optimisation d'Apache...
Apache Spark est extraordinaire lorsque tout se...
Spark haute performance : Meilleures pratiques pour la mise à l'échelle et l'optimisation d'Apache Spark - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
La mise à l'échelle de Python avec Ray : Aventures dans le cloud et les modèles sans serveur -...
L'informatique sans serveur permet aux...
La mise à l'échelle de Python avec Ray : Aventures dans le cloud et les modèles sans serveur - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Mise à l'échelle de Python avec Dask : De la science des données à l'apprentissage automatique -...
Les systèmes modernes contiennent des processeurs...
Mise à l'échelle de Python avec Dask : De la science des données à l'apprentissage automatique - Scaling Python with Dask: From Data Science to Machine Learning

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)