Вопрос Как происходит парсинг динамических страниц?

Начинающий
Статус
Оффлайн
Регистрация
14 Сен 2020
Сообщения
179
Реакции[?]
18
Поинты[?]
0
Как происходит парсинг динамических страниц?
Requests
 
Последнее редактирование:
Олдфаг
Статус
Оффлайн
Регистрация
18 Фев 2019
Сообщения
2,825
Реакции[?]
1,852
Поинты[?]
24K
Немного непонятна суть вопроса. Нужен парсер веб-страниц с использованием requests или что?
 
Начинающий
Статус
Оффлайн
Регистрация
14 Сен 2020
Сообщения
179
Реакции[?]
18
Поинты[?]
0
Немного непонятна суть вопроса. Нужен парсер веб-страниц с использованием requests или что?
Нужно объяснение, как происходит парсинг динамических веб-страниц с использованием requests.
Для динамических страниц лучше использовать Selenium

Пример:
Пожалуйста, авторизуйтесь для просмотра ссылки.
Selenium хороший вариант, но у него очень большая задержка.
 
Начинающий
Статус
Оффлайн
Регистрация
6 Янв 2021
Сообщения
15
Реакции[?]
4
Поинты[?]
0
Так прикол динамических страниц в интерпретации js, который по определению лучше сделать на браузерном движке (читай силениум). Requests тут не причем.
 
Начинающий
Статус
Оффлайн
Регистрация
14 Сен 2020
Сообщения
179
Реакции[?]
18
Поинты[?]
0
Так прикол динамических страниц в интерпретации js, который по определению лучше сделать на браузерном движке (читай силениум). Requests тут не причем.
Я наверное не правильно сформулировал вопрос, есть страница где выходят новые видео (тип YouTube) и мне нужно парсить эти новые элементы.
Или это и есть динамические элементы/страницы?
 
Начинающий
Статус
Оффлайн
Регистрация
6 Янв 2021
Сообщения
15
Реакции[?]
4
Поинты[?]
0
Я наверное не правильно сформулировал вопрос, есть страница где выходят новые видео (тип YouTube) и мне нужно парсить эти новые элементы.
Или это и есть динамические элементы/страницы?
Так-то под динамическими страницами, т.е. страницами, которые генерируются в нужный момент, можно много что понимать.
Раньше под этим понимали скорее генерацию готового html на стороне сервера (cgi, mod_php и т.д. - вот это все). Если это так, то для тебя это мало что меняет - просто получаешь готовый html и его парсишь (лучше работать сразу с DOM, а не использовать регэкспы).

Сейчас же мода формировать разметку на стороне клиента с помощью js (особенно "реактивные" страницы - всякие там реакты, ангуляры и прочий вьюджс). Здесь уже надо интерпретировать js и формировать DOM, а потом с ним работать. Вангую, что твой случай именно второй, а значит селениум в помощь.
 
Сверху Снизу