Pipelines de données avec Apache Airflow

Note :   (4,5 sur 5)

Pipelines de données avec Apache Airflow (P. Harenslak Bas)

Avis des lecteurs

Résumé:

Ce livre est hautement recommandé comme ressource complète pour l'apprentissage et l'utilisation d'Apache Airflow, couvrant à la fois les sujets de base et les sujets avancés de manière efficace. La structure permet aux lecteurs de saisir rapidement les principes fondamentaux tout en fournissant des informations approfondies pour les praticiens expérimentés. Cependant, il a été noté que les discussions sur la sécurité sont retardées jusqu'à une section ultérieure, ce que certains lecteurs trouvent préoccupant.

Avantages:

Explications détaillées, meilleures pratiques incluses, exemples de code adaptables, couvre à la fois les bases et les sujets avancés, bien écrit et structuré, excellent pour les nouveaux venus et les utilisateurs expérimentés, contient des recettes pratiques et des exemples réalistes, constitue une excellente référence.

Inconvénients:

Les questions de sécurité sont abordées tardivement dans le livre (page 322), certains lecteurs estiment qu'il manque des conseils pratiques immédiats pour les applications sur le lieu de travail.

(basé sur 12 avis de lecteurs)

Titre original :

Data Pipelines with Apache Airflow

Contenu du livre :

Data Pipelines with Apache Airflow vous apprend à construire et à maintenir des pipelines de données efficaces.

Résumé

Un pipeline réussi déplace les données efficacement, en minimisant les pauses et les blocages entre les tâches, en gardant chaque processus opérationnel tout au long du chemin. Apache Airflow fournit un environnement unique et personnalisable pour construire et gérer des pipelines de données, éliminant ainsi le besoin d'une collection hétéroclite d'outils, de code en flocon de neige et de processus maison. À l'aide de scénarios et d'exemples concrets, Data Pipelines with Apache Airflow vous apprend à simplifier et à automatiser les pipelines de données, à réduire les frais généraux d'exploitation et à intégrer harmonieusement toutes les technologies de votre pile.

L'achat du livre imprimé inclut un livre électronique gratuit aux formats PDF, Kindle et ePub de Manning Publications.

À propos de la technologie

Les pipelines de données gèrent le flux de données depuis la collecte initiale jusqu'à la consolidation, le nettoyage, l'analyse, la visualisation, etc. Apache Airflow fournit une plateforme unique que vous pouvez utiliser pour concevoir, implémenter, surveiller et maintenir vos pipelines. Son interface utilisateur conviviale, ses options plug-and-play et ses scripts Python flexibles font d'Airflow la solution idéale pour toutes les tâches de gestion des données.

A propos du livre

Data Pipelines with Apache Airflow vous apprend à construire et à maintenir des pipelines de données efficaces. Vous explorerez les modèles d'utilisation les plus courants, notamment l'agrégation de sources de données multiples, la connexion vers et depuis des lacs de données et le déploiement dans le cloud. À la fois référence et tutoriel, ce guide pratique couvre tous les aspects des graphes acycliques dirigés (DAG) qui alimentent Airflow, et explique comment les personnaliser en fonction des besoins de votre pipeline.

Ce qu'il y a à l'intérieur

Construire, tester et déployer des pipelines Airflow sous forme de DAGs.

Automatiser le déplacement et la transformation des données.

Analyser des ensembles de données historiques en utilisant le backfilling.

Développer des composants personnalisés.

Mettre en place Airflow dans des environnements de production.

A propos du lecteur

Pour les DevOps, les ingénieurs de données, les ingénieurs en apprentissage automatique et les administrateurs système ayant des compétences intermédiaires en Python.

À propos de l'auteur

Bas Harenslak et Julian de Ruiter sont des ingénieurs de données ayant une grande expérience de l'utilisation d'Airflow pour développer des pipelines pour de grandes entreprises. Bas est également un committer d'Airflow.

Table des matières

PARTIE 1 - DÉBUTER.

1 Présentation d'Apache Airflow.

2 Anatomie d'un DAG Airflow.

3 Planification dans Airflow.

4 Templer des tâches en utilisant le contexte Airflow.

5 Définir les dépendances entre les tâches.

PARTIE 2 - AU-DELA DES BASES.

6 Déclencher des workflows.

7 Communiquer avec des systèmes externes.

8 Construire des composants personnalisés.

9 Tester.

10 Exécution de tâches dans des conteneurs.

PARTIE 3 - FLUX D'AIR EN PRATIQUE

11 Meilleures pratiques.

12 Exploiter Airflow en production.

13 Sécuriser Airflow.

14 Projet : Trouver le moyen le plus rapide de se déplacer à New York.

PARTIE 4 - DANS LES NUAGES.

15 Airflow dans les nuages.

16 Airflow sur AWS.

17 Airflow sur Azure.

18 Airflow dans GCP.

Autres informations sur le livre :

ISBN :9781617296901
Auteur :
Éditeur :
Reliure :Broché
Année de publication :2021
Nombre de pages :480

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Pipelines de données avec Apache Airflow - Data Pipelines with Apache Airflow
Data Pipelines with Apache Airflow vous apprend à construire et à maintenir...
Pipelines de données avec Apache Airflow - Data Pipelines with Apache Airflow

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)