Note :
Le livre 'Querying Databricks with Spark SQL' offre une couverture complète des concepts de base et avancés de Spark SQL. Il est bien structuré avec des scénarios d'entreprise pour introduire les requêtes SQL et fournit des explications claires. Cependant, certains lecteurs ont trouvé des problèmes avec les instructions et l'organisation.
Avantages:⬤ Une couverture complète de Spark SQL, adaptée à la fois aux débutants et aux utilisateurs avancés
⬤ une structure et des explications claires
⬤ une base de données d'exemple bien conçue
⬤ une section 'Tricks and Traps' très utile
⬤ une lecture satisfaisante pour les professionnels de SQL à la recherche de sujets avancés.
⬤ Les instructions pour la configuration des ensembles de données n'étaient pas claires
⬤ Les ressources GitHub étaient mal organisées
⬤ La qualité de la reliure du livre pourrait être améliorée
⬤ Des sujets manqués tels que les instructions SQL MERGE, UPDATE, DELETE
⬤ Un problème initial avec les instructions d'importation des fichiers de données.
(basé sur 2 avis de lecteurs)
Querying Databricks with Spark SQL
Un guide pratique pour utiliser Spark SQL afin d'effectuer des requêtes complexes sur vos données Databricks.
Caractéristiques principales
● Apprenez SQL depuis le début, sans aucune connaissance préalable en programmation ou en SQL.
● Développez progressivement vos connaissances et vos compétences, de l'interrogation de données de base à l'analyse complexe.
● Acquérir une expérience pratique de SQL, couvrant tous les niveaux de connaissances, du novice à l'expert.
Description
Databricks se distingue comme une plateforme largement adoptée dédiée à la création de lacs de données. Dans son cadre, elle étend la prise en charge à une version spécialisée du langage de requête structuré (SQL) connue sous le nom de Spark SQL. Si vous souhaitez en savoir plus sur l'utilisation de Spark SQL pour analyser les données dans un lac de données, ce livre est fait pour vous.
Le livre couvre tout, des requêtes de base aux tâches complexes de traitement des données. Il commence par une introduction à SQL et à Spark. Il couvre ensuite les bases de SQL, y compris les types de données, les opérateurs et les clauses. Les chapitres suivants se concentrent sur le filtrage, l'agrégation et le calcul. En outre, il couvre les dates et les heures, le formatage des résultats et l'utilisation de la logique dans vos requêtes. Il aborde également la jonction de tables, les sous-requêtes, les tables dérivées et les expressions de table courantes. Il aborde également les sous-requêtes corrélées, la jonction et le filtrage des ensembles de données, l'utilisation de SQL dans les calculs, la segmentation et la classification des données, l'analyse en continu et l'analyse des données dans le temps. Le livre se termine par un chapitre sur la présentation avancée des données.
À la fin du livre, vous serez en mesure d'utiliser Spark SQL pour effectuer des tâches d'analyse de données complexes sur des lacs de données.
Ce que vous apprendrez
● Utiliser Spark SQL pour lire des données à partir d'un lac de données.
● Apprendre à filtrer, agréger et calculer des données à l'aide de Spark SQL.
● Apprendre à joindre des tables, à utiliser des sous-requêtes et à créer des tables dérivées dans Spark SQL.
● Analyser les données au fil du temps à l'aide de Spark SQL pour suivre les tendances et identifier les schémas dans les données.
● Présenter des données de manière visuellement attrayante à l'aide de Spark SQL.
À qui s'adresse ce livre ?
Ce livre s'adresse à tous ceux qui souhaitent apprendre à utiliser SQL pour analyser des données volumineuses. Que vous soyez analyste de données, étudiant, développeur de base de données, comptable, analyste commercial, scientifique des données ou toute autre personne ayant besoin d'extraire des informations à partir de grands ensembles de données, ce livre vous enseignera les compétences dont vous avez besoin pour accomplir votre travail.
Table des matières
1. Écrire des requêtes SQL de base
2. Filtrer les données
3. Appliquer des filtres complexes aux requêtes
4. Calculs simples
5. Agrégation des résultats
6. Travailler avec des dates dans Databricks
7. Formatage du texte dans la sortie de la requête
8. Formatage des nombres et des dates
9. Utilisation de la logique de base pour améliorer l'analyse
10. Utilisation de plusieurs tableaux lors de l'interrogation de données
11. Utilisation de jointures de tables avancées
12. Sous-requêtes
13. Tables dérivées
14. Expressions courantes des tableaux
15. Sous-requêtes corrélées
16. Manipulation d'ensembles de données
17. Utilisation de SQL pour des calculs plus avancés
18. Segmentation et classification des données
19. L'analyse par roulement
20. Analyse des données dans le temps
21. Sortie de données complexes
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)