Не удалось повторить вашу проблему:
image.png
Она ещё актуальна? Если да, прикрепите тестовый проект, в которм повторяется эта ошибка. Или напишите на каком сайте и с какими настройками действия получения кода используется проект.
Есть ли какой-то простой способ через Xpath или регулярки вытащить с любой страницы только внутренние ссылки в виде http://domain.ru ?
Сейчас вытаскиваю все ссылки с помощью Xpath, потом ищу те, которые начинаются с "/" или имени домена, а потом склеиваю их с http или https в зависимости от сайта и с самим доменом
Всё это куча условий и очень нечитабельно. Может есть более простой путь?