Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4 (2021) Видеокурс
В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.
Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.
После прохождения курса студенты будут знать:
-Как найти и установить необходимые библиотеки для парсинга данных.
-Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.
-Для чего нужен файл robots.txt.
-Каким образом получать HTML сайта для извлечения необходимой информации.
-Как пользоваться xpath для указания точного расположения элементов на странице.
-Как переходить по страницам на многостраничном сайте.
-Как создавать проект и запускать «пауков» Scrapy.
-Как парсить всю информацию о каждом товаре на сайте.
-Как осуществлять переход на страницу каждого товара.
-Каким образом парсить сайты, использующие jаvascript при загрузке.
-Как авторизовываться на сайте, используя фреймворк Selenium.
-Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.
Информация о видео
Название: Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4
Автор: Анна Кузина
Год выхода: 2021
Жанр: Видеокурс
Язык: Русский
Выпущено: Россия
Продолжительность: 02:56:22
Файл
Формат: MP4
Видео: AVC, 1280x720, ~1062 Kbps
Аудио: AAC, 128 Kbps, 48.0 KHz
Размер файла: 1.36 Gb
Внимание! У Вас нет прав для просмотра скрытого текста.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.