@Recontriver, спасибо!
Код страницы и его быстродействие
-
Привет, появилась потребность парсить сайт temu.com (китайский маркет-плейс), и т.к. наши братья китайцы прикрутили на сайт нормальную защиту для таких случаев, единственным способом остался веб браузер. Отключил все картинки и прочие ненужные всплывающие окна, суть в чем, страницу проматываю и нажимаю кнопку "показать больше товаров", подгружается HTML, который я сохраняю для своих нужд. Естественно, с каждой подгрузкой, его вес увеличивается, уже дошло до выполнения "Код страницы" около 5-8 минут, а это много. Может есть JS команды, которые внутри браузера более быстро вытянут мне HTML код страницы?
-
@gurkin4 это была самая первая реализация, на кнопке "показать больше товаров" при подгрузке создается secret_token из 120 символов, который собственно используется только 1 раз, и более не работает, сам запрос легко отслеживается, но вот повторное использование его практически невозможно, т.к. этот токен генерится из переменных, зашитых где-то на серверной части как я понял
-
@jprk1 said in Код страницы и его быстродействие:
... единственным способом остался веб браузер.
А чем еще пробовал, кроме браузера? Или там куча Javascript кода, который исполняется только в браузере и ничего, кроме браузера смысла не имеет?
-
@FastSpace said in Код страницы и его быстродействие:
@jprk1 код страницы не нужен
Вероятно, ему так удобнее для дебага:
- Скачал страницу, сохранил
- Запустил скрипт, распарсил данные
Я тоже так когда-то делал.