Apprendre Apache Drill : Maîtriser l'interrogation SQL des sources de données distribuées

Apprendre Apache Drill : Interroger et analyser des sources de données distribuées avec SQL (Charles Givre)

Avis des lecteurs

Il n'y a actuellement aucun avis de lecteur. La note est basée sur 8 votes.

Titre original :

Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL

Contenu du livre :

Prenez de la vitesse avec Apache Drill, un moteur de requête SQL distribué extensible qui lit des ensembles de données massifs dans de nombreux formats de fichiers populaires tels que Parquet, JSON et CSV. Drill lit les données dans HDFS ou dans un stockage cloud-native tel que S3 et fonctionne avec les métastores Hive ainsi qu'avec des bases de données distribuées telles que HBase, MongoDB et des bases de données relationnelles. Drill fonctionne partout : sur votre ordinateur portable ou dans votre plus grand cluster.

Dans ce livre pratique, Charles Givre et Paul Rogers, membres du comité Drill, montrent aux analystes et aux data scientists comment interroger et analyser des données brutes à l'aide de ce puissant outil. Aujourd'hui, les data scientists passent environ 80 % de leur temps à collecter et à nettoyer des données. Avec ce livre, vous apprendrez comment Drill vous aide à analyser les données plus efficacement pour réduire le temps nécessaire à la compréhension.

⬤ Les types de fichiers, y compris les fichiers journaux, Parquet, JSON et d'autres formats complexes, peuvent être interrogés.

⬤ Interroger Hadoop, les bases de données relationnelles, MongoDB, et Kafka avec le SQL standard.

⬤ Se connecter à Drill de manière programmatique en utilisant une variété de langages.

⬤ Utiliser Drill même avec des formats de fichiers difficiles ou ambigus.

⬤ Effectuer des analyses sophistiquées en étendant les fonctionnalités de Drill avec des fonctions définies par l'utilisateur.

⬤ Faciliter l'analyse de données pour la sécurité des réseaux, les métadonnées d'images et l'apprentissage automatique.

Autres informations sur le livre :

ISBN :	9781492032793
Auteur :	Charles Givre
Éditeur :	Oreilly Media
Reliure :	Broché
Année de publication :	2018
Nombre de pages :	334

Achat:

Actuellement disponible, en stock.

Apprendre Apache Drill : Interroger et analyser des sources de données distribuées avec SQL

Avis des lecteurs

Titre original :

Contenu du livre :

Autres informations sur le livre :

Achat:

Autres livres de l'auteur :

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :