Парсер категорий Ozon.ru



  • Нужен парсер Ozon.ru, для 1й итерации парсер категорий и некоторых данных с них (h1, блок текста под каталогом, исходящие ссылки на вложенные категории и др.).

    Сперва писал ТЗ для парсера на A-parser, но там пока саппорт занят. ТЗ ниже по ссылке:
    https://docs.google.com/document/d/1IgO-SoCdWoRdTtiPKhh2ZC_Gbo-a3O2Aiow42Byx5uc/

    Реализовать нужно на BrowserAutomationStudio (BAS) или в виде JS парсера для A-parser. У Вас должен быть опыт работы с каким то из этих ПО!

    Многопоточность, ротация прокси, антикапча через ПО CapMonster2 (там API такой же как в Rucaptcha).

    Требования к исполнителю
    Исполнитель должен иметь опыт работы с программированием на JS (NodeJS).
    Опыт работы с автоматизацией браузера, желательно BAS или ZennoPoster

    Желательно, если в первом сообщении Вы как то подтвердите свой опыт в данной сфере - дадите ссылку на Ваш GitHub или какие то работы из портфолио. Сообщения типа "готов взяться" не информативны, хотелось бы понимать, что потенциальный консультант и исполнитель действительно разбирается в вопросе.

    Порядок работы и оплаты
    Согласовываем с исполнителем цену (строго в рублях) и сроки. Если условия устраивают и меня и вас - работаем!
    Оплата Qiwi или р/с ИП.
    Работаю строго без предоплат! Можем договориться о поэтапных постоплатах, но только постоплатах по факту выполненных работ!

    Со студиями, компаниями не работаю! Только с индивидуальными исполнителями! Т.е. с конкретными исполнителями.



  • Там не просто Hcaptcha, а клаудфаер. Чтобы парсить запросами, надо сначала зайти на сайт через браузер, решить капчу, затем импортироваь куки в http клиент и уже парсить запрсоами. Спарсив несколько страниц, опять вылетит капча, придется заново решать капчу через браузер и так по кругу. Решений через js рабочих тоже не видел для клауда.

    Это я к тому, что на A Parser вряд ли напишут запросами.


Log in to reply