Note :
Il n'y a actuellement aucun avis de lecteur. La note est basée sur 9 votes.
Pandas for Everyone: Python Data Analysis
Introduction pratique et riche en exemples à l'analyse de données Pandas en Python.
Aujourd'hui, les analystes doivent gérer des données caractérisées par une variété, une vitesse et un volume extraordinaires. Grâce à la bibliothèque open source Pandas, vous pouvez utiliser Python pour automatiser et exécuter rapidement pratiquement n'importe quelle tâche d'analyse de données, quelle qu'en soit la taille ou la complexité. Pandas peut vous aider à garantir la véracité de vos données, à les visualiser pour prendre des décisions efficaces et à reproduire de manière fiable des analyses sur plusieurs ensembles de données.
Pandas pour tous rassemble des connaissances pratiques et des idées pour résoudre des problèmes réels avec Pandas, même si vous êtes novice en matière d'analyse de données Python. Daniel Y. Chen présente les concepts clés à l'aide d'exemples simples mais pratiques, en s'appuyant progressivement sur eux pour résoudre des problèmes plus difficiles du monde réel.
Chen vous donne un coup de pouce pour utiliser Pandas avec un ensemble de données réaliste et couvre la combinaison d'ensembles de données, le traitement des données manquantes et la structuration des ensembles de données pour faciliter l'analyse et la visualisation. Il démontre de puissantes techniques de nettoyage de données, de la manipulation de chaînes de caractères de base à l'application simultanée de fonctions à travers des cadres de données.
Une fois que vos données sont prêtes, Chen vous guide dans l'ajustement de modèles pour la prédiction, le regroupement, l'inférence et l'exploration. Il vous donne des conseils sur les performances et l'évolutivité, et vous présente l'écosystème plus large de l'analyse de données en Python.
⬤ Vous travaillerez avec des DataFrames et des Series, et importerez ou exporterez des données. Vous créerez des graphiques avec matplotlib, seaborn et pandas.
⬤ Combinez des ensembles de données et gérez les données manquantes.
⬤ Les données peuvent être remodelées, mises en ordre et nettoyées pour faciliter leur utilisation.
⬤ Convertir les types de données et manipuler les chaînes de texte.
⬤ Appliquer des fonctions pour échelonner les manipulations de données.
⬤ Agréger, transformer et filtrer de grands ensembles de données à l'aide de groupby.
⬤ Exploiter les fonctionnalités avancées de Pandas en matière de date et d'heure.
⬤ Ajuster des modèles linéaires en utilisant les bibliothèques statsmodels et scikit-learn.
⬤ Utilisez la modélisation linéaire généralisée pour ajuster des modèles avec différentes variables de réponse.
⬤ Comparer plusieurs modèles pour sélectionner le meilleur.
⬤ Régulariser pour surmonter le surajustement et améliorer les performances.
⬤ Utiliser le clustering dans l'apprentissage automatique non supervisé.
⬤ .
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)