Всем привет!
При парсинге сайта возникла потребность получить словарь заголовков h1-3 страницы вида:
{ 'h1' : 'Заголовок с h1', 'h2' : [Заголовок-1 c h2, Заголовок-2 с h2], 'h3' : [Заголовок-1 c h3, Заголовок-2 с h3, Заголовок-3 с h3]}
В результате исполнения кода я получаю только последние значения заголовков, например, на странице 5 штук h3 заголовков, а я в словаре в конце работы скрипта получаю только последний. Понимаю, что нужно использовать .append, но как его сюда внедрить не пойму. d['h1'] = d['h1'].append(то что нужно добавить) - не работает.
Результат кода:
{'h1': 'Расчетный счет', 'h2': 'Частые вопросы', 'h3': 'Расчетный счет для юридических лиц'}
При парсинге сайта возникла потребность получить словарь заголовков h1-3 страницы вида:
{ 'h1' : 'Заголовок с h1', 'h2' : [Заголовок-1 c h2, Заголовок-2 с h2], 'h3' : [Заголовок-1 c h3, Заголовок-2 с h3, Заголовок-3 с h3]}
В результате исполнения кода я получаю только последние значения заголовков, например, на странице 5 штук h3 заголовков, а я в словаре в конце работы скрипта получаю только последний. Понимаю, что нужно использовать .append, но как его сюда внедрить не пойму. d['h1'] = d['h1'].append(то что нужно добавить) - не работает.
Python:
d = {}
for heading in soup.find_all("h1"):
d['h1'] = heading.text.strip().replace("\n"," ")
for heading in soup.find_all("h2"):
d['h2'] = heading.text.strip().replace("\n"," ")
for heading in soup.find_all("h3"):
d['h3'] = heading.text.strip().replace("\n"," ")
{'h1': 'Расчетный счет', 'h2': 'Частые вопросы', 'h3': 'Расчетный счет для юридических лиц'}