@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Ресурс в список есть, а наоборот? список в ресурс
-
есть файл, в нем 200 000 строк. нужно убрать дубликаты. ресурс в список - убрать дубликаты. а дальше что? это все делает за 2 секунды... а дальше получать по одному элементу и добавить элемент? это затянется на час минимум. неужели нет функции список в ресурс?
-
@smurfik said in Ресурс в список есть, а наоборот? список в ресурс:
есть файл, в нем 200 000 строк. нужно убрать дубликаты. ресурс в список - убрать дубликаты. а дальше что? это все делает за 2 секунды... а дальше получать по одному элементу и добавить элемент? это затянется на час минимум. неужели нет функции список в ресурс?
Используй foreach )
-
@smurfik Есть в планах синхронизация ресурсов. Добавление 200к строк в ресурс через цикл заняло у меня 8 секунд. Если делаете это 1 раз, в начале работы скрипта, то это не так уж много. Конечно в режиме отладки циклы работают гораздо медленнее.

