Selenium при скроллинге страницы вниз - не подгружает контент

Tango

Новичок
Пользователь
Июл 24, 2020
1
0
1
Привет всем, я использую Selenium для того чтобы прокручивать страницу вниз для получения динамического контента и затем сделать парсинг. Не могли бы подсказать почему в моем случае скрипт прокручивает страницу до нижней части, но при этом контент не загружается?

Python:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
import time


link = 'https://vk.com/@yvkurse'

driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get(link)

SCROLL_PAUSE_TIME = 1

# Get scroll height
last_height = driver.execute_script("return document.body.scrollHeight")

while True:
    # Scroll down to bottom
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

    # Wait to load page
    time.sleep(SCROLL_PAUSE_TIME)

    # Calculate new scroll height and compare with last scroll height
    new_height = driver.execute_script("return document.body.scrollHeight")
    if new_height == last_height:
        break
    last_height = new_height


# driver.quit()
 

stud_55

Модератор
Команда форума
Модератор
Апр 3, 2020
1 522
672
113
Конкретно по этой ссылке https://vk.com/@yvkurse просто больше контента нет.
На других страницах работает. Вот пример:
Python:
from selenium import webdriver
import time


link = 'https://vk.com/open_sourcecode'

driver = webdriver.Chrome()
driver.maximize_window()
driver.get(link)
driver.implicitly_wait(3)

SCROLL_PAUSE_TIME = 1

# Get scroll height
last_height = driver.execute_script("return document.body.scrollHeight")

while True:
    # Scroll down to bottom
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    # Wait to load page
    time.sleep(SCROLL_PAUSE_TIME)

    # Calculate new scroll height and compare with last scroll height
    new_height = driver.execute_script("return document.body.scrollHeight")
    if new_height == last_height:
        break
    last_height = new_height
 
  • Мне нравится
Реакции: Student

Student

throw exception
Команда форума
Администратор
Апр 2, 2020
195
103
43
Москва
Вы попытались без селениума, просто используя свой браузер, зайти и проверить если не получите тот же результат?
 

Форум IT Специалистов