Note :
Le livre « Data Engineering With Python » est un mélange d'avantages et d'inconvénients selon les commentaires des utilisateurs. Bien qu'il fournisse une solide introduction aux concepts clés de l'ingénierie des données et qu'il soit considéré comme lisible avec des exemples pratiques, il souffre de problèmes importants liés à la précision technique et à la mise à jour du contenu. Plusieurs lecteurs ont trouvé que l'accent mis sur certains outils, en particulier NiFi, était trompeur compte tenu du titre du livre, et beaucoup ont signalé avoir rencontré une pléthore d'erreurs et une mauvaise édition qui entravent l'application pratique du matériel.
Avantages:⬤ Une solide introduction aux concepts de l'ingénierie des données et du pipelining.
⬤ Des exemples pratiques et illustratifs, en particulier avec des outils comme Pandas, Zookeeper, Kafka et Spark.
⬤ Utile pour les ingénieurs logiciels en transition et ceux qui sont familiers avec l'analyse de données.
⬤ Couverture d'une variété d'outils et de concepts dans l'ingénierie des données.
⬤ Facilité de lecture.
⬤ Nombreuses erreurs et fautes de frappe tout au long du livre, entraînant une certaine frustration.
⬤ Le contenu et les instructions d'installation obsolètes affectent de manière critique la facilité d'utilisation.
⬤ Forte concentration sur SQL avec une couverture minimale des bases de données NoSQL.
⬤ Lacunes pédagogiques, notamment en ce qui concerne la mise en place d'outils tels que NiFi.
⬤ Titre trompeur car il met l'accent sur NiFi plutôt que sur l'utilisation de Python.
⬤ Manque de clarté dans les exemples et les références, ce qui complique la tâche des débutants.
(basé sur 27 avis de lecteurs)
Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python
Construire, surveiller et gérer des pipelines de données en temps réel pour créer une infrastructure d'ingénierie de données efficace en utilisant des projets Apache open-source.
Caractéristiques principales :
⬤ Faites connaissance avec les architectures de données, la préparation des données et les compétences d'optimisation des données à l'aide d'exemples pratiques.
⬤ Concevez des modèles de données et apprenez à extraire, transformer et charger des données (ETL) à l'aide de Python.
⬤ Les élèves peuvent également apprendre à planifier, à automatiser et à surveiller des pipelines de données complexes en production.
Description du livre
L'ingénierie des données constitue la base de la science des données et de l'analyse, et représente une part importante de toutes les entreprises. Ce livre vous aidera à explorer les différents outils et méthodes utilisés pour comprendre le processus d'ingénierie des données à l'aide de Python.
Ce livre vous montrera comment relever les défis couramment rencontrés dans les différents aspects de l'ingénierie des données. Vous commencerez par une introduction aux bases de l'ingénierie des données, ainsi qu'aux technologies et aux cadres nécessaires pour construire des pipelines de données afin de travailler avec de grands ensembles de données. Vous apprendrez à transformer et à nettoyer les données et à effectuer des analyses pour tirer le meilleur parti de vos données. Au fur et à mesure de votre progression, vous découvrirez comment travailler avec des big data de complexité variable et des bases de données de production, et comment construire des pipelines de données. À l'aide d'exemples concrets, vous construirez des architectures sur lesquelles vous apprendrez à déployer des pipelines de données.
À la fin de ce livre sur Python, vous aurez acquis une compréhension claire des techniques de modélisation des données et serez en mesure de construire en toute confiance des pipelines d'ingénierie des données pour suivre les données, effectuer des contrôles de qualité et apporter les changements nécessaires en production.
Ce que vous apprendrez
⬤ Comprendre comment l'ingénierie des données soutient les flux de travail de la science des données.
⬤ Les données sont extraites de fichiers et de bases de données, puis elles sont nettoyées, transformées et enrichies.
⬤ Configurer des processeurs pour gérer différents formats de fichiers ainsi que des bases de données relationnelles et NoSQL.
⬤ Découvrez comment mettre en œuvre un pipeline de données et un tableau de bord pour visualiser les résultats.
⬤ Utilisez la mise en scène et la validation pour vérifier les données avant leur arrivée dans l'entrepôt.
⬤ Construire des pipelines en temps réel avec des zones de transit qui effectuent la validation et gèrent les échecs.
⬤ Les outils d'aide au déploiement des pipelines dans l'environnement de production.
A qui s'adresse ce livre ?
Ce livre s'adresse aux analystes de données, aux développeurs ETL et à toute personne souhaitant s'initier ou s'orienter vers le domaine de l'ingénierie des données ou rafraîchir ses connaissances en la matière à l'aide de Python. Ce livre sera également utile aux étudiants qui envisagent de faire carrière dans l'ingénierie des données ou aux professionnels de l'informatique qui se préparent à une transition. Aucune connaissance préalable de l'ingénierie des données n'est requise.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)