Как удалить ненужную ссылку при парсинге?
-
На странице имеется 11 ссылок на профили, нужно ссылки на эти профили спарсить (с этим всё понятно), НО при этом не парсить ссылку на 5-й профиль. Как это реализовать?
-
@prakash Парсить в цикле в список, при этом поставить в цикле проверку на cycle_index, если он равен 4 (cycle_index начинается с 0), то не парсить, а идти дальше.
-
@romanbiz Я немного по другому сделал.
В цикле сохраняю все ссылки в список, затем удаляю по индексу 4 и записываю список в файл.
Может какое регулярное выражение для этих целей есть, чтобы списки не плодить?
-
@prakash Смотрите, если Вы записываете в файл или базу все эти ссылки, тогда при заходе на страницу у Вас происходит начало цикла по забору ссылок и записи их куда-то. Просто в этом цикле поставить условие IF связанное с cycle_index 4 и все.