L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en utilisant des données provenant de sources brutes multiples.

Note :   (4,6 sur 5)

L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en utilisant des données provenant de sources brutes multiples. (Brian Lipp)

Avis des lecteurs

Résumé:

Ce livre est une ressource hautement recommandée pour les débutants en science des données, en particulier dans le domaine du traitement des données. Il offre une approche pratique et concrète avec des explications et des exemples détaillés. Bien que le contenu principal et la structure soient bien accueillis, plusieurs lecteurs ont noté la présence de fautes de frappe et d'erreurs qui pourraient déconcerter les utilisateurs novices.

Avantages:

Explications détaillées du code, développant l'intuition des débutants.
Une couverture complète des structures de données, des modules et des techniques pertinentes pour le traitement des données.
Des exercices pratiques et des ressources téléchargeables améliorent l'expérience d'apprentissage.
Fournit des cas d'utilisation pratiques et des exemples pour illustrer les concepts.
Convient aussi bien aux débutants qu'à ceux qui souhaitent rafraîchir leurs connaissances.

Inconvénients:

Présence de fautes de frappe et d'erreurs dans les exemples, qui peuvent frustrer les débutants.
Le livre se concentre sur les applications pratiques (« ce qui est ») plutôt que sur les explications théoriques (« pourquoi »).

(basé sur 11 avis de lecteurs)

Titre original :

The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources

Contenu du livre :

Un guide du débutant pour simplifier les processus d'extraction, de transformation et de chargement (ETL) à l'aide de conseils pratiques, d'astuces et de meilleures pratiques, d'une manière amusante et interactive.

Caractéristiques principales

⬤ Explorer le traitement des données à l'aide d'exemples concrets et de cas d'utilisation.

⬤ Les cours de formation à la gestion des données et à l'analyse de l'information sont disponibles sur le site web de l'entreprise.

⬤ Les thèmes bonus, tels que la génération de données aléatoires et les contrôles d'intégrité des données, vous permettront d'approfondir vos connaissances.

Description du livre

Bien que nous disposions d'une énorme quantité de données, celles-ci ne sont pas utiles sous leur forme brute. Pour que les données soient significatives, elles doivent être traitées et affinées.

Si vous êtes un débutant, l'atelier sur le traitement des données vous aidera à décomposer le processus. Vous commencerez par les bases et développerez vos connaissances, en progressant depuis les aspects fondamentaux du traitement des données jusqu'à l'utilisation des outils et techniques les plus populaires.

Ce livre commence par vous montrer comment travailler avec des structures de données en utilisant Python. Au travers d'exemples et d'activités, vous comprendrez pourquoi vous devriez rester à l'écart des méthodes traditionnelles de nettoyage de données utilisées dans d'autres langages et tirer parti des routines spécialisées préconstruites dans Python. Plus tard, vous apprendrez à utiliser le même backend Python pour extraire et transformer des données à partir d'un large éventail de sources, y compris l'internet, de grandes bases de données et des tableaux financiers Excel. Pour vous aider à vous préparer à des scénarios plus difficiles, le livre vous apprend à gérer les données manquantes ou incorrectes et à les reformater en fonction des exigences de votre outil d'analyse en aval.

À la fin de ce livre, vous aurez acquis une solide compréhension de la manière de manipuler des données avec Python, et appris plusieurs techniques et meilleures pratiques pour extraire, nettoyer, transformer et formater vos données efficacement, à partir d'un large éventail de sources.

Ce que vous apprendrez

⬤ Se familiariser avec les principes fondamentaux de l'extraction de données (data wrangling).

⬤ Comprendre comment modéliser les données avec la génération aléatoire de données et les contrôles d'intégrité des données.

⬤ Découvrir comment examiner les données à l'aide de statistiques descriptives et de techniques de traçage.

⬤ Explorer comment rechercher et extraire des informations avec des expressions régulières.

⬤ Découvrez les bibliothèques Python les plus utilisées dans le domaine de la science des données.

⬤ Les données manquantes peuvent être gérées et compensées de manière efficace.

A qui s'adresse ce livre ?

L'atelier sur le traitement des données est conçu pour les développeurs, les analystes de données et les analystes commerciaux qui souhaitent poursuivre une carrière en tant que scientifique des données ou expert en analyse. Bien que ce livre s'adresse aux débutants qui souhaitent s'initier au data wrangling, une connaissance préalable du langage de programmation Python est nécessaire pour appréhender facilement les concepts abordés ici. Il est également utile d'avoir une connaissance rudimentaire des bases de données relationnelles et du langage SQL.

Autres informations sur le livre :

ISBN :9781839215001
Auteur :
Éditeur :
Reliure :Broché

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en...
Un guide du débutant pour simplifier les...
L'atelier d'analyse des données, deuxième édition : Créez vos propres informations exploitables en utilisant des données provenant de sources brutes multiples. - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des...
Construire des écosystèmes de données évolutifs et...
Architectures de données modernes avec Python : Un guide pratique pour construire et déployer des pipelines de données, des entrepôts de données et des lacs de données avec Python. - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)