@suvorov_jr2 Спарсить все ссылки сайта по шаблону и не придётся проверять на дубли , а просто удалять из txt при успешном посте. Или если у сайта id статьи в виде цифры ,как здесь https://otvet.mail.ru/question/231973765 , то сгенерируй лям цифр для статей и рассылай комменты без проверки на дубли. Ещё можно проверять перед постингом, наличие на странице уникального слова, которое есть только в твоём спаме.
Как организовать быстрый парсинг страниц на содержание текста?
-
Есть 200 страниц html, я сделал открытие каждой страницы по очереди и проверку с помощью >MATCH> совпадений с определенным текстом. Проблема в том что это очень медленно.
Можно ли в БАСЕ как-то сделать чтобы он БЫСТРО парсил код каждой страницы на совпадение с моим текстом? -
Все сделал, но возникли проблемы. Скрипт нужен чтобы искать на какой странице Etsy находится товар.
С помощью Get запроса я получаю код страницы, ищу там товар IndexOf.В итоге находит на какой-то странице товар, открывает эту страницу в БАСе как обычно браузером, и в 50% товар там, а в 50% нет (при этом если через браузер найти страницу с товаром, то в этом случае уже Get запрос ее на той странице не находит).
В чем может быть проблема и как ее решить?
Или может быть можно как-то с помощью get запроса кликнуть по товару, не заходя через браузер на эту страницу?