@Naineten said in Регулярное выражение для поиска ссылок:
День добрый. Нужен ваш совет. Задача - извлечь все потенциально "видимые" ссылки с сайта перед фильтрацией. Делаю я это с помощью "Извлечь все данные" и такого регулярного выражения
href="([^"]+)"
Например, есть сайт https://dubovik.studio/ , где много динамических кнопок и всего прочего, что осложняет нажатие на такие ссылки, но помимо этого он ещё и не все из этих ссылок находит изначально. Вот те, что как минимум нужно видеть в списке после использования регулярки:
https://dubovik.studio/masters
https://dubovik.studio/akcii/
https://dubovik.studio/nashi-raboty
https://dubovik.studio/kontakty/
https://dubovik.studio/stati/
Но ни одну из ссылок она не находит, вот что находит:
ссылки.txt
Почему ссылки не подходят под регулярку?
CSS> a -- находит все ссылки