Note :
Le livre « Python Natural Language Processing Cookbook » de Zhenya Antić est généralement bien accueilli pour son approche pratique du TAL, fournissant des recettes utiles pour diverses tâches de TAL et couvrant à la fois des sujets de base et avancés. Cependant, il est critiqué pour de nombreuses erreurs de codage et des incohérences qui entravent l'expérience d'apprentissage pour certains lecteurs.
Avantages:⬤ Facile à lire avec des exemples clairs.
⬤ Utile pour les débutants comme pour les praticiens avancés.
⬤ Contient des recettes pratiques, étape par étape, pour les tâches de la PNL.
⬤ Bonne couverture des concepts modernes de la PNL, y compris l'utilisation d'outils tels que Rasa et BERT.
⬤ Le dépôt GitHub permet de faire correspondre les versions des paquets.
⬤ Aide à la construction de projets à partir de zéro.
⬤ Un nombre important d'erreurs de codage ont été trouvées dans les exemples.
⬤ Certains lecteurs ont rencontré des problèmes d'accès aux sources de données.
⬤ Explications minimales pour les concepts et la terminologie complexes.
⬤ Certains ont estimé que les transitions entre les différentes bibliothèques n'étaient pas bien expliquées.
⬤ Exige des lecteurs une connaissance préalable de certains jargons, ce qui le rend moins convivial pour les débutants que prévu.
(basé sur 15 avis de lecteurs)
Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks
Apprenez à résoudre des problèmes réels de NLP, tels que l'analyse des dépendances, l'extraction d'informations, la modélisation de sujets et la visualisation de données textuelles.
Caractéristiques principales : ⬤ Analyser des textes plus ou moins complexes à l'aide de packages Python populaires.
⬤ Analysez des textes de complexité variable à l'aide de packages Python populaires tels que NLTK, spaCy, sklearn et gensim.
⬤ Les tâches de traitement linguistique courantes et moins courantes sont mises en œuvre à l'aide de bibliothèques Python.
⬤ Surmonter les défis courants rencontrés lors de l'implémentation de pipelines NLP.
Description du livre :
Python est le langage le plus utilisé pour le traitement du langage naturel (NLP) grâce à ses nombreux outils et bibliothèques permettant d'analyser des textes et d'en extraire des données exploitables par l'ordinateur. Ce livre vous guidera à travers une gamme de techniques de traitement de texte, des bases telles que l'analyse des parties du discours aux sujets complexes tels que la modélisation des sujets, la classification des textes et la visualisation.
En commençant par une vue d'ensemble du TAL, le livre présente des recettes pour diviser les textes en phrases, pour les tronconner et les lemmatiser, pour supprimer les mots vides et pour étiqueter les parties du discours, afin de vous aider à préparer vos données. Vous apprendrez ensuite à extraire et à représenter les informations grammaticales, comme l'analyse des dépendances et la résolution des anaphores, à découvrir différentes façons de représenter la sémantique à l'aide de sacs de mots, de TF-IDF, d'enchâssements de mots et de BERT, et à développer des compétences en matière de classification de textes à l'aide de mots-clés, de SVM, de LSTM et d'autres techniques. Au fur et à mesure de votre progression, vous verrez également comment extraire des informations du texte, mettre en œuvre des techniques non supervisées et supervisées pour la modélisation de sujets, et effectuer la modélisation de sujets de textes courts, tels que les tweets. En outre, le livre vous montre comment développer des chatbots à l'aide de NLTK et de Rasa et comment visualiser des données textuelles.
À la fin de ce livre sur le traitement de texte, vous aurez acquis les compétences nécessaires pour utiliser un ensemble d'outils puissants pour le traitement de texte.
Ce que vous apprendrez :
⬤ Se familiariser avec les techniques NLP de base et avancées en Python.
⬤ Représenter l'information grammaticale dans le texte en utilisant spaCy, et l'information sémantique en utilisant bag-of-words, TF-IDF, et word embeddings.
⬤ Effectuer la classification de textes à l'aide de différentes méthodes, y compris les SVM et les LSTM.
⬤ Explorer différentes techniques de modélisation de sujets telles que K-means, LDA, NMF et BERT.
⬤ Travailler avec des techniques de visualisation telles que le NER et les nuages de mots pour différents outils de NLP.
⬤ Construire un chatbot de base en utilisant NLTK et Rasa.
⬤ Extraire des informations d'un texte en utilisant des techniques d'expressions régulières et des outils statistiques et d'apprentissage profond.
A qui s'adresse ce livre :
Ce livre s'adresse aux data scientists et aux professionnels qui souhaitent apprendre à travailler avec du texte. Une connaissance intermédiaire de Python vous aidera à tirer le meilleur parti de ce livre. Si vous êtes un praticien de la PNL, ce livre vous servira de référence de code lorsque vous travaillerez sur vos projets.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)