Как сделать парсинг части ссылок со страницы (по стилю)?



  • Здравствуйте!
    хочу настроить парсинг по сайту.
    Вот ссылка - https://www.find-org.com/search/all/?val=01
    Там когда заходишь - есть часть ссылок серых - недействующие организации, а часть - черные - т.е. те которые актуальные.
    Вопрос - как спарсить только ссылки на действующие организации?
    возможно ли это вообще? ума не приложу как это сделать...



  • @brotok said in Как сделать парсинг части ссылок со страницы (по стилю)?:

    Здравствуйте!
    хочу настроить парсинг по сайту.
    Вот ссылка - https://www.find-org.com/search/all/?val=01
    Там когда заходишь - есть часть ссылок серых - недействующие организации, а часть - черные - т.е. те которые актуальные.
    Вопрос - как спарсить только ссылки на действующие организации?
    возможно ли это вообще? ума не приложу как это сделать...

    Быстрее всего спарсить через xpath:

    //p/a[@href and ..//span[not(contains(@class,'not'))]]
    

    Тестовый скрипт


Log in to reply