Note :
Dans l'ensemble, ce livre est considéré comme une excellente ressource pour le nettoyage des données à l'aide de Python, offrant des conseils pratiques, des explications claires et de nombreux exemples de codage. Bien qu'il serve à la fois d'introduction complète pour les débutants et de référence utile pour les scientifiques de données expérimentés, certains évaluateurs ont noté des points à améliorer, en particulier dans le formatage du code et l'inclusion de graphiques.
Avantages:Le livre est très pratique, fournissant des explications claires et structurées, de nombreux exemples et une multitude de techniques pour le nettoyage, la manipulation et la visualisation des données. Il constitue une excellente introduction pour ceux qui débutent dans la science des données ou l'IA, et il est particulièrement apprécié pour ses idées, son organisation et sa facilité d'utilisation en tant que guide de référence rapide. Les évaluateurs ont apprécié l'accent mis sur la compréhension du raisonnement qui sous-tend les tâches de traitement des données, ce qui améliore l'apprentissage.
Inconvénients:Certains évaluateurs ont signalé des problèmes tels que des exemples de code mal formatés et difficiles à lire, l'utilisation minimale de graphiques qui vont à l'encontre de l'analyse exploratoire typique des données, et le besoin de sujets plus complexes, comme le nettoyage des données de séries temporelles. Quelques-uns ont noté que, bien qu'il serve de point de départ solide, il ne couvre pas tous les sujets avancés en profondeur.
(basé sur 28 avis de lecteurs)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Découvrez comment décrire vos données en détail, identifier les problèmes liés aux données et comment les résoudre à l'aide de techniques et d'astuces couramment utilisées.
Caractéristiques principales
⬤ Se familiariser avec les différentes techniques de nettoyage des données pour révéler des informations clés.
⬤ Vous avez la possibilité de manipuler des données de différentes complexités pour les mettre en forme selon les besoins de votre entreprise.
⬤ Les données peuvent être manipulées sous différentes formes pour les adapter aux besoins de l'entreprise.
Description du livre
Il est essentiel d'obtenir des données propres pour révéler des informations, car se lancer directement dans l'analyse des données sans les nettoyer correctement peut conduire à des résultats erronés. Ce livre vous présente des outils et des techniques que vous pouvez appliquer pour nettoyer et traiter les données avec Python. Vous commencerez par vous familiariser avec la forme des données en utilisant des pratiques qui peuvent être déployées de manière routinière avec la plupart des sources de données. Ensuite, le livre vous apprend à manipuler les données pour leur donner une forme utile. Vous apprendrez également à filtrer et à résumer les données pour obtenir des informations et mieux comprendre ce qui a du sens et ce qui n'en a pas, tout en découvrant comment exploiter les données pour résoudre les problèmes que vous avez identifiés. Ensuite, vous effectuerez des tâches clés, telles que le traitement des valeurs manquantes, la validation des erreurs, la suppression des données dupliquées, le contrôle des gros volumes de données et le traitement des valeurs aberrantes et des dates non valides. Ensuite, vous découvrirez des recettes sur l'utilisation de l'apprentissage supervisé et de l'analyse Naive Bayes pour identifier les valeurs inattendues et les erreurs de classification, et vous générerez des visualisations pour l'analyse exploratoire des données (AED) afin de visualiser les valeurs inattendues. Enfin, vous créerez des fonctions et des classes que vous pourrez réutiliser sans modification lorsque vous disposerez de nouvelles données.
A la fin de ce livre sur Python, vous serez équipé de toutes les compétences clés dont vous avez besoin pour nettoyer les données et diagnostiquer les problèmes qu'elles contiennent.
Ce que vous apprendrez
⬤ Découvrez comment lire et analyser des données provenant de diverses sources.
⬤ Produire des résumés des attributs des cadres de données, des colonnes et des lignes.
⬤ Filtrer les données et sélectionner les colonnes d'intérêt qui répondent à des critères donnés.
⬤ Les données peuvent être filtrées et les colonnes intéressantes sélectionnées en fonction de critères donnés.
⬤ Améliorer votre productivité dans Python pandas en utilisant le chaînage de méthodes.
⬤ Utiliser des visualisations pour obtenir des informations supplémentaires et identifier les problèmes potentiels liés aux données.
⬤ Améliorer votre capacité à comprendre ce qui se passe dans vos données.
⬤ Construire des fonctions et des classes définies par l'utilisateur pour automatiser le nettoyage des données.
A qui s'adresse ce livre ?
Ce livre s'adresse à tous ceux qui cherchent des moyens de traiter des données désordonnées, dupliquées et de mauvaise qualité en utilisant différents outils et techniques Python. Le livre adopte une approche basée sur des recettes pour vous aider à apprendre comment nettoyer et gérer les données. Une connaissance pratique de la programmation Python est tout ce dont vous avez besoin pour tirer le meilleur parti de ce livre.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)