Как извлечь ссылку из текста з помощью регулярки?
-
У меня есть текст (не код) типа: "Для авторизации перейдите по ссылке https://goodf.net". Как мне извлечь https://goodf.net?
-
@fOrest94 Например вот так
@out said in Помогите поправить регулярку:
https?://([.a-zA-Z0-9%_-]+.*?)/?
взять группу №1
-
@fox Даная регулярка дает только goodf.net, а надо goodf.net/auth/login/eyJhbGciOiJIUzUxMiIsImlhdCI6MTU0NjcwMTMzNSwiZXhwIjoxNTQ2NzYxMzM1fQ.eyJpZCI6MjQzNjB9.HhusY1Q3pG2ldcr3fK7bvL5g_MzfwvTlwSIs8CP9BvgE1exPD33cz140ab2tp6Va0M5pb8eBg6hWECGtAMoMtw
-
@forest94 Может такую регулярку https?://([.a-zA-Z0-9%_-]+.*?)/[\S\s]+
Только вместо GROUP1, нужно брать ALL_MATCH.
-
@forest94 said in Как извлечь ссылку из текста з помощью регулярки?:
@fox Даная регулярка дает только goodf.net, а надо goodf.net/auth/login/eyJhbGciOiJIUzUxMiIsImlhdCI6MTU0NjcwMTMzNSwiZXhwIjoxNTQ2NzYxMzM1fQ.eyJpZCI6MjQzNjB9.HhusY1Q3pG2ldcr3fK7bvL5g_MzfwvTlwSIs8CP9BvgE1exPD33cz140ab2tp6Va0M5pb8eBg6hWECGtAMoMtw
Я вам и в личке говорил, скиньте код страницы, в разы проще будет составить регулярку, чем гадать, есть там https в начале ссылки или нет, будут ли символы после ссылки и тому подобное.
Может проще получить эту ссылку через xpath. (Да, вы уже писали в личке, что в коде другая ссылка, но нужная вам ссылка обычно тоже дублируется в формате гиперссылки тегом a/href)Пока можете попробовать такой вариант:
(https?:\/\/(?:.*?\/)*?.*)
-
@fox Спасибо.