Парсинг

s591962

Новичок
Пользователь
Окт 12, 2021
130
3
18
Программа по парсингу сайта поиска гугл с вопросом test
Код:
#! python3
#lucky.pu - Открывает несколько результатов поиска

import requests, sys, webbrowser, bs4
from bs4 import BeautifulSoup
import json

res = requests.get('https://www.google.com/search?q=test')
soup = bs4.BeautifulSoup(res.text,'lxml') # Извлечение первых несколько найденых ссылок.
soups = soup.find(class_="egMi0 kCrYT")
print("soups=",soups)
numOpen = min(5, len(soups))
print("numOpen=", soups.get('href'))
for i in range(numOpen):
    webbrowser.open('http://google.com' + soups[i].get('href'))

Получаю soups= <div class="egMi0 kCrYT"><a href="/url?q=https://www.speedtest.net/ru&amp; те между a href= и https://www.speedtest.net/ru&amp какое то "/url?q. Скорее всего оно и дает ошибку при обращении. Что заменить?
 
Последнее редактирование:

Форум IT Специалистов