Note :
Il n'y a actuellement aucun avis de lecteur. La note est basée sur 8 votes.
Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
Prenez de la vitesse avec Apache Drill, un moteur de requête SQL distribué extensible qui lit des ensembles de données massifs dans de nombreux formats de fichiers populaires tels que Parquet, JSON et CSV. Drill lit les données dans HDFS ou dans un stockage cloud-native tel que S3 et fonctionne avec les métastores Hive ainsi qu'avec des bases de données distribuées telles que HBase, MongoDB et des bases de données relationnelles. Drill fonctionne partout : sur votre ordinateur portable ou dans votre plus grand cluster.
Dans ce livre pratique, Charles Givre et Paul Rogers, membres du comité Drill, montrent aux analystes et aux data scientists comment interroger et analyser des données brutes à l'aide de ce puissant outil. Aujourd'hui, les data scientists passent environ 80 % de leur temps à collecter et à nettoyer des données. Avec ce livre, vous apprendrez comment Drill vous aide à analyser les données plus efficacement pour réduire le temps nécessaire à la compréhension.
⬤ Les types de fichiers, y compris les fichiers journaux, Parquet, JSON et d'autres formats complexes, peuvent être interrogés.
⬤ Interroger Hadoop, les bases de données relationnelles, MongoDB, et Kafka avec le SQL standard.
⬤ Se connecter à Drill de manière programmatique en utilisant une variété de langages.
⬤ Utiliser Drill même avec des formats de fichiers difficiles ou ambigus.
⬤ Effectuer des analyses sophistiquées en étendant les fonctionnalités de Drill avec des fonctions définies par l'utilisateur.
⬤ Faciliter l'analyse de données pour la sécurité des réseaux, les métadonnées d'images et l'apprentissage automatique.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)