Traitement des données avec Optimus : Optimiser les tâches de préparation des big data pour l'analyse et l'apprentissage automatique avec Optimus en utilisant Dask et PySpark

Note :   (4,7 sur 5)

Traitement des données avec Optimus : Optimiser les tâches de préparation des big data pour l'analyse et l'apprentissage automatique avec Optimus en utilisant Dask et PySpark (Argenis Leon)

Avis des lecteurs

Résumé:

Ce livre est apprécié pour sa couverture complète du traitement des données à l'aide de Pandas et d'Optimus, ce qui en fait une ressource précieuse pour les nouveaux venus comme pour les professionnels expérimentés du traitement des données. Il simplifie les tâches complexes liées aux données et améliore l'efficacité du flux de travail.

Avantages:

Fournit des conseils détaillés sur le prétraitement des données avec Pandas et Optimus.

Inconvénients:

Excellent pour apprendre et accélérer le traitement et la transformation des données.

(basé sur 4 avis de lecteurs)

Titre original :

Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Contenu du livre :

Rédigé par l'équipe principale d'Optimus, ce guide complet vous aidera à comprendre comment Optimus améliore l'ensemble du paysage du traitement des données.

Caractéristiques principales :

⬤ Chargez, fusionnez et sauvegardez efficacement les petites et grandes données avec Optimus.

⬤ Apprenez les fonctions d'Optimus pour l'analyse des données, l'ingénierie des caractéristiques, l'apprentissage automatique, la validation croisée et le NLP.

⬤ Découvrez comment Optimus améliore les autres technologies de cadres de données et vous aide à accélérer vos tâches de traitement de données.

Description du livre :

Optimus est une bibliothèque Python qui fonctionne comme une API unifiée pour le nettoyage, le traitement et la fusion de données. Elle peut être utilisée pour traiter de petites et grandes données sur votre ordinateur portable local ou sur des clusters distants utilisant des CPU ou des GPU.

Le livre commence par couvrir les aspects internes d'Optimus et la manière dont il fonctionne en tandem avec les technologies existantes pour répondre à vos besoins en matière de traitement des données. Vous apprendrez ensuite à utiliser Optimus pour charger et enregistrer des données à partir de formats de données texte tels que les fichiers CSV et JSON, pour explorer des fichiers binaires tels qu'Excel, et pour le traitement de données en colonnes avec Parquet, Avro et OCR. Ensuite, vous vous familiariserez avec le profileur et ses types de données - une caractéristique unique d'Optimus Dataframe qui contribue à la qualité des données. Vous verrez comment utiliser les graphiques disponibles dans Optimus, tels que les histogrammes, les graphiques de fréquence, les diagrammes de dispersion et les diagrammes en boîte, et comprendrez comment Optimus vous permet de vous connecter à des bibliothèques telles que Plotly et Altair. Vous vous pencherez également sur des applications avancées telles que l'ingénierie des caractéristiques, l'apprentissage automatique, la validation croisée et les fonctions de traitement du langage naturel, et vous explorerez les avancées d'Optimus. Enfin, vous apprendrez à créer des fonctions de nettoyage et de transformation des données et à ajouter un nouveau moteur de traitement des données hypothétique avec Optimus.

À la fin de ce livre, vous serez en mesure d'améliorer facilement votre flux de travail en science des données avec Optimus.

Ce que vous apprendrez

⬤ Utiliser plus de 100 fonctions de traitement de données sur des colonnes et d'autres valeurs de type chaîne.

⬤ Les données sont remodelées et pivotées afin d'obtenir un résultat dans le format requis.

⬤ Découvrez comment tracer des histogrammes, des graphiques de fréquence, des diagrammes de dispersion, des diagrammes en boîte, etc.

⬤ Connectez Optimus avec des bibliothèques de visualisation Python populaires telles que Plotly et Altair.

⬤ Appliquer des techniques de regroupement de chaînes de caractères pour normaliser les chaînes de caractères.

⬤ Découvrir des fonctions pour explorer, corriger et supprimer les données de mauvaise qualité.

⬤ Utiliser des techniques avancées pour supprimer les valeurs aberrantes de vos données.

⬤ Ajouter des moteurs et des fonctions personnalisées pour nettoyer, traiter et fusionner les données.

A qui s'adresse ce livre :

Ce livre s'adresse aux développeurs Python qui souhaitent explorer, transformer et préparer les big data pour l'apprentissage automatique, l'analyse et la création de rapports en utilisant Optimus, une API unifiée pour travailler avec Pandas, Dask, cuDF, Dask-cuDF, Vaex et Spark. Bien que cela ne soit pas nécessaire, des connaissances de niveau débutant en Python seront utiles. Une connaissance de base du CLI est nécessaire pour installer Optimus et ses exigences. Pour utiliser les technologies GPU, vous aurez besoin d'une carte graphique NVIDIA compatible avec la bibliothèque RAPIDS de NVIDIA, qui est compatible avec Windows 10 et Linux.

Autres informations sur le livre :

ISBN :9781801079563
Auteur :
Éditeur :
Langue :anglais
Reliure :Broché

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Traitement des données avec Optimus : Optimiser les tâches de préparation des big data pour...
Rédigé par l'équipe principale d'Optimus, ce guide...
Traitement des données avec Optimus : Optimiser les tâches de préparation des big data pour l'analyse et l'apprentissage automatique avec Optimus en utilisant Dask et PySpark - Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)