@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Помощь в реализация решения двух капч
-
На сайте рандомным образом появляется одна из выше перечисленных капч, я реализовал это в виде двух блоков решения капчи в виде рекапча и ашкапча, убрав галочку о том, что если объект не будет найден перейти к следубщесу действию, то есть если идёт рекапча то он её решает и переходит к этапу решение ашкапчи(её естественно нет) и скрипт ждёт время для перехода к след этапу, но бывает, что за время ожидания одного из блоков капча просит пройти её ещё раз, а скрипт уже переходит к другим этапам "ввод текста" соответственно работа его не верна, в этом и вопрос как сделать так, чтоб можно было сделать проверку, мол если рекпачка то решать (например блоком 1), если ашкапча то перейти к соответствующему блоку выполнения, надеюсь смог объяснить проблему
-
@Pandera поставьте проверку после решения каждой из капчи, например while(пока не решит) на каждый блок
пока не решит например называем переменную и определяем ей false как решит значение true, и проверку успешного решения перед 2 блоком, что бы проверял ее наличие например до того как начнет решать второй блок и после успешного решения и метки... я бы не использовал их, а реализовал бы 2 цикла 1 это успешность всего второй а вернее вторые решение каждой капчи. Но это не принципиально, вам нужно реализовать проверку каждого блока в не зависимости от того что он решает получается. Как вар напишите функцию проверки и вызываете ее после каждого действия. -
@prakash у него рамблер, немного сложнее все. Придется мини костыль писать. Там может рекаптча в втором, третьем или четвёртом фрейме с разными сайт ключами подгрузится. Надо в цикле пройтись и составить правильный селектор всех каптч, а затем проверить какой тебе подкинули фрейм. Плюс по такой же логике hcaptha.
