Note :
Ce livre sert d'introduction à Dask et à ses capacités, mais les critiques sont mitigées en ce qui concerne son public cible et la profondeur de l'information. Bien qu'il offre une bonne vue d'ensemble et des comparaisons avec Pandas, il plonge souvent dans des concepts élémentaires qui peuvent ne pas être pertinents pour les lecteurs visés.
Avantages:⬤ Bonne introduction pour les débutants
⬤ explications solides des structures de données de Dask
⬤ comparaison efficace avec Pandas
⬤ ressource précieuse pour comprendre les concepts de la science des données
⬤ syntaxe et cas d'utilisation clairs.
⬤ Trop basique pour les utilisateurs intermédiaires
⬤ inclut des concepts élémentaires non pertinents
⬤ la mise en page et la structure pourraient être améliorées
⬤ quelques problèmes techniques notés
⬤ le contenu peut être trop détaillé pour le public visé.
(basé sur 6 avis de lecteurs)
Data Science with Python and Dask
Résumé
Dask est un outil d'analyse parallèle natif conçu pour s'intégrer de manière transparente aux bibliothèques que vous utilisez déjà, notamment Pandas, NumPy et Scikit-Learn. Avec Dask, vous pouvez analyser et travailler avec d'énormes ensembles de données en utilisant les outils dont vous disposez déjà. Et Data Science with Python and Dask est votre guide pour utiliser Dask pour vos projets de données sans changer votre façon de travailler.
L'achat du livre imprimé inclut un livre électronique gratuit aux formats PDF, Kindle et ePub de Manning Publications. Vous trouverez les instructions d'inscription à l'intérieur du livre imprimé.
À propos de la technologie
Un pipeline de données efficace est essentiel à la réussite d'un projet de science des données. Dask est une bibliothèque flexible pour le calcul parallèle en Python qui facilite la création de flux de travail intuitifs pour l'ingestion et l'analyse de grands ensembles de données distribuées. Dask propose une planification dynamique des tâches et des collections parallèles qui étendent les fonctionnalités de NumPy, Pandas et Scikit-learn, permettant aux utilisateurs de faire évoluer leur code d'un simple ordinateur portable à un cluster de centaines de machines en toute simplicité.
À propos du livre
La science des données avec Python et Dask vous apprend à construire des projets évolutifs qui peuvent gérer des ensembles de données massifs. Après avoir découvert le framework Dask, vous analyserez les données de la base de données des tickets de parking de NYC et utiliserez les DataFrames pour rationaliser votre processus. Ensuite, vous créerez des modèles d'apprentissage automatique à l'aide de Dask-ML, élaborerez des visualisations interactives et construirez des clusters à l'aide d'AWS et de Docker.
Ce qu'il y a à l'intérieur
⬤ Travailler avec de grands ensembles de données structurées et non structurées.
⬤ La visualisation avec Seaborn et Datashader.
⬤ La mise en œuvre de vos propres algorithmes.
⬤ Construire des applications distribuées avec Dask Distributed.
⬤ L'emballage et le déploiement des applications Dask.
A propos du lecteur
Pour les scientifiques des données et les développeurs ayant une expérience de Python et de la pile PyData.
À propos de l'auteur
Jesse Daniel est un développeur Python expérimenté. Il a enseigné Python pour la science des données à l'Université de Denver et dirige une équipe de scientifiques des données dans une entreprise de technologie des médias basée à Denver.
Table des matières
PARTIE 1 - Les éléments constitutifs de l'informatique évolutive.
⬤ Pourquoi l'informatique évolutive est importante.
⬤ Présentation de Dask.
PARTIE 2 - Travailler avec des données structurées en utilisant Dask DataFrames.
⬤ Introduction aux DataFrames de Dask.
⬤ Chargement des données dans les DataFrames.
⬤ Nettoyage et transformation des DataFrames.
⬤ Résumer et analyser les DataFrames.
⬤ Visualisation des DataFrames avec Seaborn.
⬤ Visualisation des données de localisation avec Datashader.
PARTIE 3 - Étendre et déployer Dask.
⬤ Travailler avec des sacs et des tableaux.
⬤ Apprentissage machine avec Dask-ML.
⬤ Mise à l'échelle et déploiement de Dask.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)