Note :

Le livre a reçu des critiques mitigées, certains lecteurs appréciant son style d'écriture accessible et son introduction aux concepts clés, tandis que d'autres critiquent son manque de profondeur, d'organisation et d'aides visuelles.
Avantages:⬤ Rédigé de manière professionnelle et avec humour
⬤ permet une bonne compréhension du contexte et de l'histoire
⬤ excellente introduction pour les débutants en ingénierie des données ou en analyse
⬤ récit accessible expliquant Spark et les aspects pratiques
⬤ permet une flexibilité dans les langages et les outils.
⬤ Manque de captures d'écran, ce qui le rend difficile à suivre
⬤ couverture superficielle des sujets
⬤ mal organisé
⬤ manque de profondeur sur Spark et Databricks
⬤ certains lecteurs l'ont trouvé frustrant et peu utile.
(basé sur 7 avis de lecteurs)
Beginning Apache Spark Using Azure Databricks: Unleashing Large Cluster Analytics in the Cloud
1. Introduction à l'analyse de données à grande échelle.
2. Spark et Databricks.
3. Démarrer avec Databricks.
4. Espaces de travail, Clusters et Notebooks.
5. Obtenir des données dans Databricks.
6. Interroger les données à l'aide de SQL.
7. La puissance de Python.
8. ETL et traitement avancé des données.
9. Se connecter à et depuis l'étranger.
10. Exécution en production.
11. Bits et pièces.