@suvorov_jr2 Спарсить все ссылки сайта по шаблону и не придётся проверять на дубли , а просто удалять из txt при успешном посте. Или если у сайта id статьи в виде цифры ,как здесь https://otvet.mail.ru/question/231973765 , то сгенерируй лям цифр для статей и рассылай комменты без проверки на дубли. Ещё можно проверять перед постингом, наличие на странице уникального слова, которое есть только в твоём спаме.
Как вытащить слова из текста начинающиеся на https
-
например текст, он может быть абсолютно любым:
Доброе утро, сегодня прекрасный день, температура воздуха на 9 часов составляет https://(vk.com или fb.com)/ссылка1. К обеду, небо затянули облака и температура понизилась https://(vk.com или fb.com)/ссылка2. Буквально вчера к это время была температура https://(vk.com или fb.com)/ссылка3 и т.д. Как с таких текстов вытащить ссылки и поместить их в список.
Чтобы получилось.
https://(vk.com или fb.com)/ссылка1
https://(vk.com или fb.com)/ссылка2
https://(vk.com или fb.com)/ссылка3в идеале нужен список
ссылка1
ссылка2
ссылка3 -
@Alexx5l6 said in Как вытащить слова из текста начинающиеся на https:
Доброе утро, сегодня прекрасный день, температура воздуха на 9 часов составляет https://(vk.com или fb.com)/ссылка1. К обеду, небо затянули облака и температура понизилась https://(vk.com или fb.com)/ссылка2. Буквально вчера к это время была температура https://(vk.com или fb.com)/ссылка3 и т.д. Как с таких текстов вытащить ссылки и поместить их в список.
Если парсишь с сайта, то можно и при помощи xpath, это довольно удобно


