@smeckoi77 Уже разобрался, и еще одно, можете помочь, у меня после того как он прочел файл, там ссылки в нем находится в файле, потом выводит в лог все ссылки одни в одну строчку, а у меня в самом тхт написано каждая строка идет, а он в одну строку сместил все ссылки, как сделать чтобы он читал каждую строчку, а не весь файл целеком, буду благодарен, что поможете!
Как спарсить разом все ссылки?
-
@crazymazy, Да, с помощью XPath
-
Нашел, что можно это сделать вот так //*//a/@href
Заметил такой ньюанс, если ссылки в странице имеют вид href='урл', а не href="урл", то ссылки в список загоняются в виде "\ 'урл\ '" (у меня тут пробелы лишние, иначе не показать)Кто шарит в XPath подскажите, пожалуйста, как это чистить на ходу? (имею ввиду при парсинге) Спасибо