Парсинг с помощью Python
Книги

Парсинг с помощью Python

Книги

Парсинг с помощью Python

Митчелл, Р. Парсинг с помощью Python : веб-скрапинг в действии : перевод с английского / Р. Митчелл. — Астана : Sprint book, 2025. — 952 с.. — Перевод издания: Web scraping with Python: data extraction from the modern web. — ISBN 978-601-08-4570-1.

Аннотация

Если программирование - магия, то веб-скрапинг - настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию. Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга. Книга покажет, как: анализировать сложные HTML-страницы; разрабатывать веб-сканеры с помощью фреймворка Scrapy; хранить данные, полученные с помощью скрапинга; читать и извлекать данные из документов; очищать и нормализовывать плохо отформатированные данные; читать и записывать информацию на естественных языках; выполнять поиск по формам и страницам входа; выполнять скрапинг JavaScript-кода и работать с API; писать и использовать программы для преобразования изображений в текст; обходить противоскрапинговые ловушки и блокаторы ботов; тестировать свои веб-сайты с помощью скрапинга.
  • УДК:
    004.7
  • ISBN:
    978-601-08-4570-1

Рекомендовано к ознакомлению

Отзывы читателей

0