Всем добрый день.
Я совсем новичок, так что не судите строго( У меня есть задача вытащить некоторые данные из веб-страниц и я сейчас пытаюсь написать скрипт, который на эти страницы хотя бы заходил. Начала с выборки адресов страниц. Смогла сделать выборку нужных страниц со ссылками на них, но теперь мне нужно оставить только ссылки, чтобы затем скрипт по ним по списку заходил. И вот это не получается(
Код пробую такой:
Но начиная с 'for..' судя по всему какая-то ошибка. Помогите, пожалуйста, разобраться, как из полученного списка ссылок + страниц оставить только ссылки.
Использую Python 3.9.0 и windows 10.
Заранее спасибо!
Я совсем новичок, так что не судите строго( У меня есть задача вытащить некоторые данные из веб-страниц и я сейчас пытаюсь написать скрипт, который на эти страницы хотя бы заходил. Начала с выборки адресов страниц. Смогла сделать выборку нужных страниц со ссылками на них, но теперь мне нужно оставить только ссылки, чтобы затем скрипт по ним по списку заходил. И вот это не получается(
Код пробую такой:
Python:
from bs4 import BeautifulSoup
import requests
import re
import csv
resp = requests.get('https://gcn.gsfc.nasa.gov/gcn3_archive.html')
soup = BeautifulSoup(resp.text, 'lxml')
lst_li = soup.find_all(lambda tag:tag.name=='li' and ("Konus-Wind detection" in tag.text or "Konus-Wind observation" in tag.text))
for href in lst_li:
link=href.get('href',None)
if link is not None:
print(link)
Использую Python 3.9.0 и windows 10.
Заранее спасибо!
Последнее редактирование: