Validité, fiabilité et importance : Méthodes empiriques pour la PNL et la science des données

Validité, fiabilité et importance : Méthodes empiriques pour la PNL et la science des données (Stefan Riezler)

Titre original :

Validity, Reliability, and Significance: Empirical Methods for Nlp and Data Science

Contenu du livre :

Les méthodes empiriques sont des moyens de répondre aux questions méthodologiques des sciences empiriques par des techniques statistiques. Les questions méthodologiques abordées dans cet ouvrage comprennent les problèmes de validité, de fiabilité et de signification. Dans le cas de l'apprentissage automatique, il s'agit respectivement de savoir si un modèle prédit ce qu'il est censé prédire, si les performances d'un modèle sont cohérentes d'une réplication à l'autre et si une différence de performance entre deux modèles est due au hasard. L'objectif de ce livre est de répondre à ces questions par des tests statistiques concrets qui peuvent être appliqués pour évaluer la validité, la fiabilité et la signification de l'annotation des données et de la prédiction de l'apprentissage automatique dans les domaines du NLP et de la science des données.

Nous nous concentrons sur les méthodes empiriques basées sur des modèles où les annotations de données et les prédictions de modèles sont traitées comme des données d'entraînement pour des modèles probabilistes interprétables issus des familles bien connues des modèles additifs généralisés (GAM) et des modèles linéaires à effets mixtes (LMEM). Sur la base des paramètres interprétables des GAM ou LMEM entraînés, le livre présente des tests statistiques basés sur le modèle, tels qu'un test de validité qui permet de détecter les caractéristiques circulaires qui contournent l'apprentissage. En outre, le livre traite d'un coefficient de fiabilité utilisant la décomposition de la variance basée sur les paramètres d'effet aléatoire des LMEM. Enfin, un test de signification basé sur le rapport de vraisemblance de LMEM imbriqués entraînés sur les scores de performance de deux modèles d'apprentissage automatique permet naturellement d'inclure des variations dans les méta-paramètres dans les tests d'hypothèse, et facilite en outre une comparaison raffinée du système conditionnelle aux propriétés des données d'entrée.

Ce livre peut être utilisé comme une introduction aux méthodes empiriques pour l'apprentissage automatique en général, avec un accent particulier sur les applications en NLP et en science des données. Le livre est autonome, avec une annexe sur le contexte mathématique des GAM et LMEM, et avec une page web d'accompagnement comprenant le code R pour reproduire les expériences présentées dans le livre.

Autres informations sur le livre :

ISBN :9781636392714
Auteur :
Éditeur :
Reliure :Broché
Année de publication :2021
Nombre de pages :165

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Validité, fiabilité et importance : Méthodes empiriques pour la PNL et la science des données -...
Les méthodes empiriques sont des moyens de...
Validité, fiabilité et importance : Méthodes empiriques pour la PNL et la science des données - Validity, Reliability, and Significance: Empirical Methods for Nlp and Data Science

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)