@bigorat Уже нашел ответ
([^<]+)[>]
<https://domain.com/cat/3e54e7dd16b142fe736b.js?max_age=31536000>; rel=modulepreload; crossorigin=anonymous; as=script,
Берет из строки только ссылку
@crazymazy, Да, с помощью XPath
Нашел, что можно это сделать вот так //*//a/@href
Заметил такой ньюанс, если ссылки в странице имеют вид href='урл', а не href="урл", то ссылки в список загоняются в виде "\ 'урл\ '" (у меня тут пробелы лишние, иначе не показать)
Кто шарит в XPath подскажите, пожалуйста, как это чистить на ходу? (имею ввиду при парсинге) Спасибо