La science des données en ligne de commande : Améliorez vos compétences en matière d'analyse

La science des données en ligne de commande : Obtenir, analyser, explorer et modéliser des données à l'aide d'outils Unix puissants (Jeroen Janssens)

Avis des lecteurs

Résumé:

Les critiques soulignent que le livre est bien écrit et attrayant, et qu'il rend intéressant un sujet potentiellement aride. Il fournit des conseils utiles, en particulier pour ceux qui travaillent avec des fichiers CSV et des outils en ligne de commande.

Avantages:

Bien écrit, attrayant, conseils et recommandations utiles, exemples clairs, particulièrement intéressant pour les utilisateurs de fichiers CSV, concis et précis, inclut des outils programmés par l'auteur.

Inconvénients:

Les exemples de code peuvent être déroutants pour les utilisateurs débutants de la ligne de commande.

(basé sur 5 avis de lecteurs)

Titre original :

Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power Tools

Contenu du livre :

Ce guide entièrement révisé démontre comment la flexibilité de la ligne de commande peut vous aider à devenir un scientifique des données plus efficace et plus productif. Vous apprendrez à combiner des outils de ligne de commande petits mais puissants pour obtenir, analyser, explorer et modéliser rapidement vos données. Pour commencer, l'auteur Jeroen Janssens fournit une image Docker contenant plus de 100 outils Unix, utiles que vous travailliez sous Windows, macOS ou Linux.

Vous découvrirez rapidement pourquoi la ligne de commande est une technologie agile, évolutive et extensible. Même si vous êtes à l'aise dans le traitement des données avec Python ou R, vous apprendrez comment améliorer considérablement votre flux de travail en science des données en tirant parti de la puissance de la ligne de commande. Ce livre est idéal pour les data scientists, les analystes, les ingénieurs, les administrateurs système et les chercheurs.

⬤ Obtenir des données à partir de sites Web, d'API, de bases de données et de feuilles de calcul.

⬤ Effectuer des opérations de nettoyage sur des fichiers texte, CSV, HTML, XML et JSON.

⬤ Explorer les données, calculer des statistiques descriptives et créer des visualisations.

⬤ Gérer votre flux de travail en science des données.

⬤ Créez vos propres outils à partir de lignes simples et de code Python ou R existant.

⬤ Paralléliser et distribuer des pipelines de données intensifs.

⬤ Modéliser les données avec des algorithmes de réduction de la dimensionnalité, de régression et de classification.

⬤ Exploiter la ligne de commande de Python, Jupyter, R, RStudio et Apache Spark.

Autres informations sur le livre :

ISBN :	9781492087915
Auteur :	Jeroen Janssens
Éditeur :	Oreilly Media
Reliure :	Broché
Année de publication :	2021
Nombre de pages :	250

Achat:

Actuellement disponible, en stock.

La science des données en ligne de commande : Obtenir, analyser, explorer et modéliser des données à l'aide d'outils Unix puissants

Avis des lecteurs

Titre original :

Contenu du livre :

Autres informations sur le livre :

Achat:

Autres livres de l'auteur :

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :