Python Web Scraping Cookbook - Maîtriser l'extraction de données Web avec plus de 90 recettes

Python Web Scraping Cookbook : Plus de 90 recettes éprouvées pour vous permettre de faire du scraping avec Python, des microservices, Docker et AWS (Michael Heydt)

Avis des lecteurs

Résumé:

Le livre sur le web scraping a reçu des critiques largement négatives, les utilisateurs exprimant leur frustration quant à son manque de profondeur et de conseils pratiques. Certains ont estimé qu'il était plus utile de chercher de l'aide dans des ressources en ligne telles que YouTube et Stack Overflow.

Avantages:

Certains utilisateurs ont trouvé que le livre pouvait fournir des connaissances de base sur les différentes bibliothèques de scraping et pourrait être utile pour les utilisateurs intéressés par le crawling plutôt que par le scraping de sites connus.

Inconvénients:

Le livre ne fournit pas suffisamment de détails pour une application pratique, en particulier pour les débutants/intermédiaires. Il manque des sujets essentiels comme la gestion des mots de passe et le JavaScript. Beaucoup l'ont trouvé inadéquat et ont suggéré que les ressources en ligne sont bien plus efficaces.

(basé sur 3 avis de lecteurs)

Titre original :

Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS

Contenu du livre :

Démêlez les complexités du web scraping et accédez facilement aux données web à l'aide de scripts Python.

Fonctionnalités principales

⬤ Des recettes pratiques pour faire progresser vos compétences en web scraping jusqu'au niveau expert.

⬤ Un guide unique pour résoudre les tâches complexes et difficiles du web scraping à l'aide de Python.

⬤ Comprendre les structures des pages web et collecter les données d'un site web en toute simplicité.

Description du livre

Python Web Scraping Cookbook est un livre axé sur les solutions qui vous enseignera des techniques pour développer des scrapers performants et gérer les crawlers, les sitemaps, l'automatisation des formulaires, les sites basés sur Ajax, les caches, et bien plus encore.

Vous explorerez un certain nombre de scénarios du monde réel où chaque partie du cycle de vie du développement/produit sera entièrement couverte. Vous développerez non seulement les compétences nécessaires pour concevoir et développer des flux de données fiables et performants, mais aussi pour déployer votre base de code sur AWS. Si vous êtes impliqué dans l'ingénierie logicielle, le développement de produits ou l'exploration de données (ou si vous êtes intéressé par la création de produits axés sur les données), vous trouverez ce livre utile car chaque recette a un but et un objectif clairs. Qu'il s'agisse d'extraire des données des sites web ou d'écrire un crawler web sophistiqué, les recettes indépendantes de ce livre seront une aubaine. Ce livre couvre les bibliothèques Python, les requêtes et BeautifulSoup. Vous apprendrez ce qu'est le crawling, le web spidering, le travail avec des sites web Ajax, les éléments paginés, et plus encore. Vous apprendrez également à résoudre des problèmes tels que les erreurs 403, le travail avec un proxy, le scraping d'images et le LXML.

A la fin de ce livre, vous serez capable de scraper des sites web de manière plus efficace et vous serez capable de.

Déployer et exploiter votre scraper dans le cloud.

Ce que vous apprendrez

⬤ Utiliser une variété d'outils pour scraper n'importe quel site web et données, y compris BeautifulSoup, Scrapy, Selenium et bien d'autres.

⬤ Maîtriser les langages d'expression, tels que XPath et CSS, et les expressions régulières pour extraire des données web.

⬤ Les outils d'aide à la création de sites web, tels que les champs de formulaire cachés, le throttling, la pagination et les différents codes d'état, sont autant de pièges à éviter.

⬤ Construire des pipelines de scraping robustes avec SQS et RabbitMQ.

⬤ Les techniques de scraping telles que les images et les médias et apprendre ce qu'il faut faire lorsque le Scraper ne fonctionne pas.

⬤ Explorer les techniques ETL pour construire un crawler personnalisé, analyser et convertir les données structurées et non structurées des sites Web.

⬤ Déployer et exécuter votre scraper en tant que service dans AWS Elastic Container Service.

A qui s'adresse ce livre ?

Ce livre est idéal pour les programmeurs Python, les administrateurs web, les professionnels de la sécurité et toute personne souhaitant réaliser des analyses web. Une bonne connaissance de Python et une compréhension de base du web scraping seront utiles pour tirer le meilleur parti de ce livre.

Autres informations sur le livre :

ISBN :	9781787285217
Auteur :	Michael Heydt
Éditeur :	Packt Pub
Langue :	anglais
Reliure :	Broché

Achat:

Actuellement disponible, en stock.

Python Web Scraping Cookbook : Plus de 90 recettes éprouvées pour vous permettre de faire du scraping avec Python, des microservices, Docker et AWS

Avis des lecteurs

Titre original :

Contenu du livre :

Autres informations sur le livre :

Achat:

Autres livres de l'auteur :

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :