Data Ingestion with Python Cookbook : Un guide pratique pour l'ingestion, la surveillance et l'identification des erreurs dans le processus d'ingestion des données.

Note :   (4,1 sur 5)

Data Ingestion with Python Cookbook : Un guide pratique pour l'ingestion, la surveillance et l'identification des erreurs dans le processus d'ingestion des données. (Glucia Esppenchutz)

Avis des lecteurs

Résumé:

Ce livre est une ressource hautement recommandée pour les ingénieurs de données, fournissant des connaissances approfondies et des conseils pratiques sur la construction de pipelines d'ingestion de données efficaces à l'aide d'outils open-source. Il couvre des sujets essentiels, notamment la découverte de données, les processus d'ingestion, la gestion des erreurs et l'observabilité des données, ce qui le rend adapté aux débutants comme aux professionnels chevronnés.

Avantages:

Il offre des explications pratiques et des exemples du monde réel, couvre un large éventail de sujets essentiels dans l'ingestion de données, se concentre sur les outils open-source, inclut des instructions détaillées sur la gestion des erreurs et la surveillance, présente des exemples détaillés avec du code, et fournit des informations précieuses sur l'observabilité et la gouvernance des données.

Inconvénients:

Certains lecteurs souhaitaient plus de détails sur des piles d'ingénierie de données populaires spécifiques telles que Dbt et Snowflake.

(basé sur 4 avis de lecteurs)

Titre original :

Data Ingestion with Python Cookbook: A practical guide to ingesting, monitoring, and identifying errors in the data ingestion process

Contenu du livre :

Déployez votre pipeline d'ingestion de données, orchestrez et surveillez efficacement pour éviter toute perte de données et de qualité.

L'achat de la version imprimée ou du livre Kindle inclut un livre électronique PDF gratuit.

Caractéristiques principales :

⬤ Mettre à profit les meilleures pratiques pour créer un pipeline d'ingestion de données en Python et PySpark.

⬤ Automatisez et orchestrez vos pipelines de données en utilisant Apache Airflow.

⬤ Les données de la base de données sont utilisées pour l'analyse des données de la base de données de la base de données de la base de données de la base de données de la base de données de la base de données de la base de données.

Description du livre :

Data Ingestion with Python Cookbook propose une approche pratique de la conception et de la mise en œuvre de pipelines d'ingestion de données. Il présente des exemples du monde réel avec les outils open source les plus largement reconnus sur le marché pour répondre aux questions les plus courantes et surmonter les défis.

Vous serez initié à la conception et au travail avec ou sans schémas de données, ainsi qu'à la création de pipelines contrôlés avec Airflow et les principes d'observabilité des données, tout en suivant les meilleures pratiques de l'industrie. Le livre aborde également les défis associés à la lecture de différentes sources et formats de données. Au fur et à mesure que vous avancerez dans le livre, vous comprendrez mieux les meilleures pratiques en matière de journalisation des erreurs, les techniques de dépannage, l'orchestration des données, la surveillance et le stockage des journaux en vue d'une consultation ultérieure.

À la fin du livre, vous disposerez d'un ensemble entièrement automatisé qui vous permettra de commencer à ingérer et à surveiller votre pipeline de données sans effort, facilitant ainsi une intégration transparente avec les étapes ultérieures du processus ETL.

Ce que vous apprendrez

⬤ Mettre en œuvre l'observabilité des données à l'aide d'outils de surveillance.

⬤ Automatiser votre pipeline d'ingestion de données.

⬤ Lire les données analytiques et partitionnées, qu'elles soient basées sur un schéma ou non.

⬤ Déboguer et prévenir les pertes de données grâce à une surveillance et une journalisation efficaces des données.

⬤ Établir des politiques d'accès aux données à l'aide d'un cadre de gouvernance des données.

⬤ Construire un cadre d'orchestration des données pour améliorer la qualité des données.

A qui s'adresse ce livre :

Ce livre s'adresse aux ingénieurs et aux passionnés de données qui cherchent à comprendre le processus d'ingestion des données à l'aide d'outils populaires de la communauté open source. Pour les apprenants plus avancés, ce livre aborde les piliers théoriques de la gouvernance des données tout en fournissant des exemples pratiques de scénarios du monde réel couramment rencontrés par les ingénieurs de données.

Autres informations sur le livre :

ISBN :9781837632602
Auteur :
Éditeur :
Langue :anglais
Reliure :Broché

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Data Ingestion with Python Cookbook : Un guide pratique pour l'ingestion, la surveillance et...
Déployez votre pipeline d'ingestion de données,...
Data Ingestion with Python Cookbook : Un guide pratique pour l'ingestion, la surveillance et l'identification des erreurs dans le processus d'ingestion des données. - Data Ingestion with Python Cookbook: A practical guide to ingesting, monitoring, and identifying errors in the data ingestion process

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)