Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des pipelines de données, des entrepôts de données et des lacs de données avec Python.

Note :   (4,7 sur 5)

Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des pipelines de données, des entrepôts de données et des lacs de données avec Python. (Brian Lipp)

Avis des lecteurs

Résumé:

Le livre fournit une exploration approfondie et perspicace des architectures de données modernes, en se concentrant sur l'architecture delta, la gouvernance des données et la construction de produits de données dans un cadre de maillage de données. Il met également l'accent sur l'importance de la visualisation des données et des applications pratiques dans des scénarios du monde réel à l'aide de Python.

Avantages:

Couverture complète des architectures de données modernes, exemples pratiques en Python, exploration perspicace de la gouvernance et de l'intégrité des données, accent mis sur les MLOps et l'intégration des visualisations de données, accessible aux ingénieurs, analystes et managers.

Inconvénients:

Peut être trop technique pour les débutants qui n'ont pas de connaissances préalables des architectures de données, certains lecteurs peuvent trouver la profondeur trop importante, et il peut ne pas couvrir tous les sujets en détail.

(basé sur 5 avis de lecteurs)

Titre original :

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Contenu du livre :

Construire des écosystèmes de données évolutifs et fiables en utilisant Data Mesh, Databricks Spark et Kafka.

Caractéristiques principales :

⬤ Développer des compétences modernes en matière de données utilisées dans les technologies émergentes.

⬤ Apprendre des méthodologies de conception pragmatiques telles que Data Mesh et Data Lakehouses.

⬤ Acquérir une compréhension plus approfondie de la gouvernance des données.

⬤ L'achat de la version imprimée ou du livre Kindle inclut un livre électronique PDF gratuit.

Description du livre :

Modern Data Architectures with Python vous apprendra à incorporer de manière transparente vos flux de travail d'apprentissage automatique et de science des données dans vos plates-formes de données ouvertes. Vous apprendrez à prendre vos données et à créer des lacustres ouverts qui fonctionnent avec n'importe quelle technologie en utilisant des techniques éprouvées, y compris l'architecture en médaillon et Delta Lake.

En commençant par les fondamentaux, ce livre vous aidera à construire des pipelines sur Databricks, une plateforme de données ouverte, en utilisant SQL et Python. Vous comprendrez les notebooks et les applications écrites en Python à l'aide d'outils d'ingénierie logicielle standard tels que git, pre-commit, Jenkins et Github. Ensuite, vous vous plongerez dans le traitement des données en continu et par lots à l'aide d'Apache Spark et de Confluent Kafka. Au fur et à mesure de votre progression, vous apprendrez à déployer vos ressources à l'aide de l'infrastructure en tant que code et à automatiser vos flux de travail et le développement du code. La capacité de toute plateforme de données à gérer et à travailler avec l'IA et le ML étant un élément vital, vous explorerez également les bases du ML et la manière de travailler avec des outils MLOps modernes. Enfin, vous obtiendrez une expérience pratique avec Apache Spark, l'une des technologies de données clés sur le marché actuel.

À la fin de ce livre, vous aurez accumulé une multitude de connaissances pratiques et théoriques pour construire, gérer, orchestrer et architecturer vos écosystèmes de données.

Ce que vous apprendrez

⬤ Comprendre les modèles de données, y compris l'architecture delta.

⬤ Découvrir comment augmenter les performances avec les composants internes de Spark.

⬤ Découvrir comment concevoir des diagrammes de données critiques.

⬤ Explorer les MLOps avec des outils tels que AutoML et MLflow.

⬤ Les données sont un élément essentiel de la gestion de l'entreprise et de l'économie.

⬤ Découvrez la gouvernance des données et renforcez la confiance dans vos données.

⬤ Les données de l'entreprise peuvent être visualisées et les tableaux de bord introduits dans votre pratique des données.

A qui s'adresse ce livre :

Ce livre s'adresse aux développeurs, aux ingénieurs analytiques et aux managers qui cherchent à développer un écosystème de données au sein de leur organisation. Bien qu'il ne s'agisse pas de prérequis, une connaissance de base de Python et une expérience préalable des données vous aideront à lire et à suivre les exemples.

Autres informations sur le livre :

ISBN :9781801070492
Auteur :
Éditeur :
Langue :anglais
Reliure :Broché

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en...
Un guide du débutant pour simplifier les...
L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en utilisant des données provenant de sources brutes multiples. - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des...
Construire des écosystèmes de données évolutifs et...
Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des pipelines de données, des entrepôts de données et des lacs de données avec Python. - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)