Нужно извлечь ссылки из файла.
Делаю через "Извлечь все данные"
<a href="https://site.com/page.html">.+</a>
P.S. Когда пробовал на тестовом файле все было нормально. Но на основном ничего не находит. Основной файл - это дамп sql базы (может это как-то влияет).