Поиск

Закладки

Озвучивание недоступно

Озвучить книгу

Изменить режим чтения

Изменить размер шрифта

Оглавление

Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Скрапинг веб-сайтов с помощю Python

ЧАСТЬ I. ПОСТРОЕНИЕ СКРАПЕРОВ

Предыдущая страница

Следующая страница

Table of contents

Предисловие

Вступление

ЧАСТЬ I. ПОСТРОЕНИЕ СКРАПЕРОВ -

Глава 1. Ваш первый скрапер

Соединение с Интернетом

Введение в BeautifulSoup

Установка BeautifulSoup

Запуск BeautifulSoup

Как обеспечить надежный скрапинг

Глава 2. Продвинутый парсинг HTML

Вам не всегда нужен молоток

Еще одно применение BeautifulSoup

find() и findAll()

Другие объекты BeautifulSoup

Навигация по дереву синтаксического разбора

Работа с дочерними элементами и элементами-потомками

Работа с одноуровневыми элементами

Работа с родительскими элементами

Регулярные выражения

Регулярные выражения и BeautifulSoup

Работа с атрибутами

Лямбда-выражения

За рамками BeautifulSoup

Глава 3. Запуск краулера

Обход отдельного домена

Краулинг всего сайта

Сбор данных по всему сайту

Краулинг Интернета

Краулинг с помощью Scrapy

Глава 4. Использование API

Как работают API

Общепринятые соглашения

Аутентификация

Вызовы API

Несколько примеров

Приступаем к работе

Несколько примеров

Приступаем к работе

Несколько примеров

Парсинг JSON-данных

Возвращаем все это домой

Подробнее о применении API

Глава 5. Хранение данных

Медиафайлы

Сохранение данных в формате CSV

Установка MySQL

Некоторые основные команды

Интеграция с Python

Методы работы с базами данных и эффективная практика

"Шесть шагов" в MySQL

Электронная почта

Глава 6. Чтение документов

Кодировка документа

Кодировка текста и глобальный Интернет

Чтение CSV-файлов

Microsoft Word и .docx

ЧАСТЬ II. ПРОДВИНУТЫЙ СКРАПИНГ +

Приложение А. Кратко о том, как работает Python +

Приложение В. Кратко о том, как работает Интернет

Приложение С. Правовые и этические аспекты веб-скрапинга +

Об авторе

Предметный указатель

Данный блок поддерживает скрол*