Как спарсить разом все ссылки?



  • День добрый, подскажите можно ли как-нибудь разом спарсить все ссылки на странице? На данный момент получилось реализовать цикличный парсинг по 1ой ссылке, что довольно таки долго..



  • @crazymazy, Да, с помощью XPath



  • Нашел, что можно это сделать вот так //*//a/@href
    Заметил такой ньюанс, если ссылки в странице имеют вид href='урл', а не href="урл", то ссылки в список загоняются в виде "\ 'урл\ '" (у меня тут пробелы лишние, иначе не показать)

    Кто шарит в XPath подскажите, пожалуйста, как это чистить на ходу? (имею ввиду при парсинге) Спасибо


Log in to reply
 

  • 4
  • 33
  • 3
  • 4
  • 8
  • 5
  • 2
  • 6