Я сошел с ума.
Если подключаться через прокси - дичь какая то, яндекс не грузятся ЯДзен, Авто.ру и все прочее что ниже строки запроса поиска.
Ну никак не получается собрать все ссылки на станице
-
Господа, бьюсь уже пол дня.
- Загружаю страницу
- Код страницы
- Регулярные выражения - извлечь все данные.
Туда пихаю такую регулярку: <a\ href="+([\s\S]+)"+
Регулярку составлял через онлайн конструктор.
На выходе получаю SCAN RESULT LIST с кучей мусора.
Как грамотно выпарсить только ссылочки со страницы?
-