Задание Python Junior.
Парсинг сайта tengrinews.kz
Выходные данные - таблицы в БД mysql, со следующей структурой:
Язык программирования: Python
Используемые библиотеки: Beautiful Soup, Selenium, Pymysql
Этапы парсинга:
Что парсить в новостях:
Что парсить в комментариях:
Парсинг сайта tengrinews.kz
Выходные данные - таблицы в БД mysql, со следующей структурой:
Язык программирования: Python
Используемые библиотеки: Beautiful Soup, Selenium, Pymysql
Этапы парсинга:
- Открыть главную страницу сайта.
- Спарсить список ссылок из блока последних новостей и записать в БД
- Открыть ссылку на новость полученную ранее
- Спарсить требуемые данные о новости и записать в БД
- Парсинг комментариев и запись в БД
Что парсить в новостях:
Что парсить в комментариях: