Ну никак не получается собрать все ссылки на станице

Kodak

Господа, бьюсь уже пол дня.

Загружаю страницу
Код страницы
Регулярные выражения - извлечь все данные.
Туда пихаю такую регулярку: <a\ href="+([\s\S]+)"+
Регулярку составлял через онлайн конструктор.
На выходе получаю SCAN RESULT LIST с кучей мусора.

Как грамотно выпарсить только ссылочки со страницы?

Kodak

Как обычно сразу спрашиваю потом ищу ответ на форуме. Разобрался как через хпатч вытащить все ссылки через получить каждый xml/
Помогите теперь как изменить регулярку //a/@href
что бы парсились только те ссылки, в которых в урл есть вхождение "page"

allive

@kodak составить xpath с page но вот так телепатически трудно, вы бы хоть показали из чего дергать.

solt

@kodak said in Ну никак не получается собрать все ссылки на станице:

Помогите теперь как изменить регулярку //a/@href

Как вариант Xpath запрос

//a[contains(@href, 'page')]/@href

Bablosoft

Ну никак не получается собрать все ссылки на станице

Подключение на socks медленнее чем на http прокси

не работают мобильные прокси

BAS не прогружает.

Не получается ввести текст на сайте

Как переключиться на вкладку - надругой сайт, выполнить там определенные операции, и вернуться обратно на предыдущий сайт ?