Парсинг

Нурмухамед

Новичок
Пользователь
Май 21, 2020
2
0
1
Задание Python Junior.


Парсинг сайта tengrinews.kz



Выходные данные - таблицы в БД mysql, со следующей структурой:






Язык программирования: Python

Используемые библиотеки: Beautiful Soup, Selenium, Pymysql



Этапы парсинга:

Открыть главную страницу сайта.

Спарсить список ссылок из блока последних новостей и записать в БД




Открыть ссылку на новость полученную ранее

Спарсить требуемые данные о новости и записать в БД

Парсинг комментариев и запись в БД



Что парсить в новостях:







Что парсить в комментариях:

 

Форум IT Специалистов