Note :
Ce livre constitue une solide introduction à Apache Spark, en particulier pour ceux qui sont déjà familiarisés avec le développement de logiciels. Il est bien structuré, couvrant des sujets de base à avancés, principalement en Python et abordant les fonctionnalités pertinentes de Spark. Cependant, certains utilisateurs ont noté des informations obsolètes, en particulier en ce qui concerne les installations, et un manque de cas d'utilisation avancés ou de couverture en profondeur dans certains domaines.
Avantages:⬤ Fournit une approche bien structurée et méthodique pour un apprentissage rapide.
⬤ Bon pour les débutants et les passionnés de Python.
⬤ Couvre une grande variété de fonctionnalités Spark, y compris Spark-SQL et MLlib.
⬤ Accessible et facile à assimiler, il convient à une mise en œuvre rapide de Spark.
⬤ Inclut des références à des articles de recherche pour une compréhension plus approfondie.
⬤ Certaines informations sont obsolètes, notamment en ce qui concerne les installations et les binaires Hadoop.
⬤ Il manque des cas d'utilisation avancés et des conseils d'optimisation des performances.
⬤ Principalement axé sur Python, avec moins d'emphase sur Scala ou les sujets avancés.
⬤ Plusieurs fautes d'orthographe relevées, indiquant la nécessité d'une meilleure relecture.
⬤ Certains chapitres, comme Spark Streaming, manquent de profondeur.
(basé sur 23 avis de lecteurs)
Apache Spark in 24 Hours, Sams Teach Yourself
Apache Spark est un moteur de traitement distribué open source rapide, évolutif et flexible pour les systèmes big data. Il s'agit de l'un des projets big data open source les plus actifs à ce jour. En seulement 24 leçons d'une heure ou moins, Sams Teach Yourself Apache Spark in 24 Hours vous aide à construire des solutions Big Data pratiques qui tirent parti de la vitesse, de l'évolutivité, de la simplicité et de la polyvalence étonnantes de Spark.
L'approche directe de ce livre, étape par étape, vous montre comment déployer, programmer, optimiser, gérer, intégrer et étendre Spark, maintenant et pour les années à venir. Vous découvrirez comment créer des solutions puissantes englobant l'informatique en nuage, le traitement des flux en temps réel, l'apprentissage automatique et bien plus encore. Chaque leçon s'appuie sur ce que vous avez déjà appris, vous donnant une base solide pour réussir dans le monde réel.
Que vous soyez analyste de données, ingénieur de données, scientifique de données ou gestionnaire de données, l'apprentissage de Spark vous aidera à faire progresser votre carrière ou à vous lancer dans une nouvelle carrière dans le domaine en plein essor du Big Data.
Apprenez à.
- Découvrir ce que fait Apache Spark et comment il s'intègre dans le paysage du Big Data.
- Déployer et exécuter Spark localement ou dans le cloud.
- Interagir avec Spark à partir du shell.
- Tirer le meilleur parti de l'architecture Spark Cluster.
- Développer des applications Spark avec Scala et Python fonctionnel.
- Programmer avec l'API Spark, y compris les transformations et les actions.
- Appliquer des approches pratiques d'ingénierie/analyse de données conçues pour Spark.
- Utiliser les RDD (Resilient Distributed Datasets) pour la mise en cache, la persistance et la sortie.
- Optimiser les performances de la solution Spark.
- Utiliser Spark avec SQL (via Spark SQL) et avec NoSQL (via Cassandra).
- Exploiter les techniques de programmation fonctionnelle de pointe.
- Étendre Spark avec le streaming, R et Sparkling Water.
- Commencer à construire des applications d'apprentissage automatique et de traitement de graphes basées sur Spark.
- Explorer les technologies de messagerie avancées, y compris Kafka.
- Prévisualiser et se préparer à la prochaine génération d'innovations de Spark.
Des instructions vous guident à travers les questions, les problèmes et les tâches les plus courants.
Les questions-réponses, les quiz et les exercices vous permettent d'approfondir et de tester vos connaissances.
Les astuces Did You Know ? offrent des conseils d'initiés et des raccourcis.
Et les alertes Watch Out vous aident à éviter les pièges. Lorsque vous aurez terminé, vous serez à l'aise avec Apache Spark pour résoudre un large éventail de problèmes liés au Big Data.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)