
Data Wrangling: Concepts, Applications and Tools
DATA WRANGLING
Rédigé et édité par certains des plus grands experts mondiaux dans le domaine, ce nouveau volume passionnant présente la recherche de pointe et les dernières percées technologiques dans le domaine du traitement des données, ses concepts théoriques, ses applications pratiques et ses outils pour résoudre les problèmes de tous les jours.
Le traitement des données est le processus de nettoyage et d'unification d'ensembles de données désordonnés et complexes pour en faciliter l'accès et l'analyse. Ce processus comprend généralement la conversion manuelle et le mappage des données d'un format brut vers un autre format afin de permettre une consommation et une organisation plus pratiques des données. La manipulation des données est de plus en plus omniprésente dans les grandes entreprises d'aujourd'hui.
Le nettoyage des données consiste à supprimer les données inexactes de votre ensemble de données, tandis que le traitement des données consiste à transformer le format des données, généralement en convertissant les données "brutes" en un autre format plus adapté à leur utilisation. Le traitement des données est une composante nécessaire de toute entreprise. Les solutions de traitement des données sont spécifiquement conçues et architecturées pour traiter des données diverses et complexes à n'importe quelle échelle, y compris de nombreuses applications, telles que Datameer, Infogix, Paxata, Talend, Tamr, TMMData et Trifacta.
Ce livre synthétise les processus de traitement des données dans une vue d'ensemble complète, en mettant l'accent sur les processus analytiques agiles récents et en évolution rapide dans les entreprises axées sur les données, à l'intention des entreprises et d'autres entreprises pour trouver des solutions à leurs problèmes quotidiens et à leurs applications pratiques. Qu'il s'agisse d'un ingénieur chevronné, d'un scientifique ou d'un autre professionnel de l'industrie, ce livre est indispensable à toute bibliothèque.