@clocky bez raznici, mobilnie ili rezidenti
dopustim u tebya 10 potokov, 9 proxy
9 potokov rabotaet, 10 jdet kogda osvoboditsa proxy... zakonchit dopustim 1-y, on osvobodil svoyu stroky proxy=>10 potok startuet s etoy strokoy, a 1-y jdet kogda stanet dostupen resurs voobshe lubogo potoka(t.e. esli zakonchit uslovniy 7-y=>1 potok startanet s proxy 7-go, a 7-y budet jdat kogda resurs snova stanet svobodetn) vot takoy cycle
poetomy s resursami vse ok, esli eto mob proxy, mojesh delat v nachale scripta sbros ip, tak tochno budesh uveren, chto noviy potok nachnetsa s novim ip
Как отключить сложные картинки ?
-
Тока там такой теперь прикол. Если карту вырубить, то листать вниз низя. Не подгружает контент и спарсить не выйдет.
Включил карту обратно, тока аватары вырубил и начал парсить теперь.
А ещё такой вопрос. Парсю эти элементы через НАЧАТЬ ЦИКЛ, ну он их нашёл 3000шт и потом каждый цикл проходит по всему списку чтобы 1 элемент собрать, представляешь ?
В общем долго парсит, не знаешь как можно обойти задержку ?
Есть ли способ на запросах собрать эту малину ?А ещё потом внутрь буду запрыгивать и от туда дёргать сливки.
-
@xclsv если делать через xpath быстрей будет или так же ?
@uraabk Расскажите про особенности вашего варианта парсера ?
Дело в том, что я парсил около 10 часов базу в 2500шт таких вот деталей.
Потом поставил функцию заходить в каждую ссылку и от туда уже грабить инфу.Но блин функция НАЧАТЬ ЦИКЛ работает так медленно. Ей приходится каждый раз весь список пролистывать, чтобы собрать 1шт элемент.
И так он проходил 2500 раз весь список и собирал по 1 элементу =(
Очень долго так парсить, и если будут больше базы, то это удар по времени очень большой. -
Ну достать ссылки на адреса сайтов я хочу, а потом через датакол спарсить емаил из доменов разных организаций.
Скажите, как сделать так, чтобы можно было зайти на сайт, про сканировать его и вытащить от туда адрес емаил ?
Вроде датакол справляется с этим делом, но он такой тяжёлый и так долго всё это делает.

