Бот кликает по ссылкам и они открываются, заранее их брать нельзя так как они меняются.
Ссылки типа "vk.com/..." как заменять их на тоже самое но спереди добавлять "m.vk.com/..." тоесть "m."
@f0cus учту, однако хочу заметить разбираться можно и на готовых примерах. Я изучаю все по ходу разработки, последовательно по надобности и такие темы создаю не только для того что бы получить готовое решение.
Здравствуйте!
хочу настроить парсинг по сайту.
Вот ссылка - https://www.find-org.com/search/all/?val=01
Там когда заходишь - есть часть ссылок серых - недействующие организации, а часть - черные - т.е. те которые актуальные.
Вопрос - как спарсить только ссылки на действующие организации?
возможно ли это вообще? ума не приложу как это сделать...
Быстрее всего спарсить через xpath:
//p/a[@href and ..//span[not(contains(@class,'not'))]]