alt text
Таким образом добился нужного результата, все домены кроме разрешенных ведут на мой вебсервер, который отдаёт пустой контент на любой домен, для https самоподписаный сертификат + команда хрома для игнора ошибки серта как на скрине.
например текст, он может быть абсолютно любым:
Доброе утро, сегодня прекрасный день, температура воздуха на 9 часов составляет https://(vk.com или fb.com)/ссылка1. К обеду, небо затянули облака и температура понизилась https://(vk.com или fb.com)/ссылка2. Буквально вчера к это время была температура https://(vk.com или fb.com)/ссылка3 и т.д. Как с таких текстов вытащить ссылки и поместить их в список.
Чтобы получилось.
https://(vk.com или fb.com)/ссылка1
https://(vk.com или fb.com)/ссылка2
https://(vk.com или fb.com)/ссылка3
в идеале нужен список
ссылка1
ссылка2
ссылка3
@Alexx5l6 said in Как вытащить слова из текста начинающиеся на https:
Доброе утро, сегодня прекрасный день, температура воздуха на 9 часов составляет https://(vk.com или fb.com)/ссылка1. К обеду, небо затянули облака и температура понизилась https://(vk.com или fb.com)/ссылка2. Буквально вчера к это время была температура https://(vk.com или fb.com)/ссылка3 и т.д. Как с таких текстов вытащить ссылки и поместить их в список.
Если парсишь с сайта, то можно и при помощи xpath, это довольно удобно