
Data Analytics for the Social Sciences: Applications in R
Data Analytics for the Social Sciences est une introduction à l'analyse des données pour les sciences sociales. Il présente des applications du langage R, sans doute l'outil statistique le plus répandu et le plus utilisé par les chercheurs.
Le livre commence par un chapitre sur l'éthique, qui traite des utilisations et des abus potentiels de l'analyse des données. Les chapitres 2 et 3 montrent comment mettre en œuvre un large éventail de procédures statistiques dans R. Les chapitres 4 et 5 traitent des arbres de régression et de classification et des forêts aléatoires. Le chapitre 6 traite des modèles d'apprentissage automatique et du paquetage "caret", qui met à la disposition du chercheur des centaines de modèles. Le chapitre 7 traite de l'analyse des réseaux neuronaux et le chapitre 8 de l'analyse des réseaux et de la visualisation des données de réseaux. Un dernier chapitre traite de l'analyse de texte, y compris le web scraping, les tableaux comparatifs de fréquence de mots, les nuages de mots, les cartes de mots, l'analyse de sentiment, l'analyse de sujet, et plus encore. Tous les chapitres empiriques comportent deux exercices "Quick Start" conçus pour permettre une immersion rapide dans les thèmes du chapitre, suivis d'une couverture "In Depth". Les données sont disponibles pour tous les exemples et le code R exécutable est fourni dans un "Résumé des commandes". Une annexe fournit un tutoriel étendu sur R et RStudio. Près de 30 suppléments en ligne fournissent des informations pour le livre complet, des "livres dans le livre" sur une variété de sujets, tels que la modélisation basée sur les agents.
Plutôt que de se concentrer sur les équations, les dérivations et les preuves, ce livre met l'accent sur l'obtention pratique de résultats pour divers modèles de sciences sociales et sur la manière d'interpréter ces résultats. Il convient à tous les étudiants de premier cycle et de troisième cycle de niveau avancé qui apprennent l'analyse statistique des données.