Как удалить ненужную ссылку при парсинге?



  • На странице имеется 11 ссылок на профили, нужно ссылки на эти профили спарсить (с этим всё понятно), НО при этом не парсить ссылку на 5-й профиль. Как это реализовать?



  • @prakash Парсить в цикле в список, при этом поставить в цикле проверку на cycle_index, если он равен 4 (cycle_index начинается с 0), то не парсить, а идти дальше.



  • @romanbiz Я немного по другому сделал.
    В цикле сохраняю все ссылки в список, затем удаляю по индексу 4 и записываю список в файл.
    Может какое регулярное выражение для этих целей есть, чтобы списки не плодить?



  • @prakash Смотрите, если Вы записываете в файл или базу все эти ссылки, тогда при заходе на страницу у Вас происходит начало цикла по забору ссылок и записи их куда-то. Просто в этом цикле поставить условие IF связанное с cycle_index 4 и все.


Log in to reply