@paini Так дело в том что парсит например 200 ссылок и все ок. Потом в одном месте стопорится и все. Я не думаю что на конкретной странице верстка другая и xpath другой.
Не думаю что проблема в прокси. На сайте кажеться вообще никакой защиты кроме авторизации по фейсбук. Датакол собрал ссылки в несколько потоков без прокси и все ок.
@paini Галочки убрал где нужно. Появились ошибки таймаута по загрузке старниц- поставил игнор ошибок. Работает пока не вылазит такая ошибка Таймаут во время выполнения lenght for[documentRoot all .map] - сталкивались с таким ?
В контексте разметки HTML страницы парсинг получается логичным. Нов случае XML-фида нарушается структура XML-файла
Как получить значение вложенное в area?
Не могу сам разобраться. Делаю HTTP GET запрос к RSS XML
Xpath получить каждый xml //brand
он мне выдает список
XPATH_XML_LIST: [
"<brand/>"
"<brand/>"
"<brand/>"
"<brand/>"
"<brand/>"
Почему закрывающий тег? Как название брэнда выхватить, что не так делаю?
Вы перечитайте ваше сообщение и подумайте, на основании какой информации из вашего поста другие пользователи смогут вам помочь?