@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Строка из ресурса раз в час.
-
@FastSpace В настройках ресурса есть параметр "время между использованиями" выставляй час в миллисекундах. Но по моему ты неправильно объяснил свою задачу, либо строишь огород..
-
@Fox said in Строка из ресурса раз в час.:
@FastSpace В настройках ресурса есть параметр "время между использованиями" выставляй час в миллисекундах. Но по моему ты неправильно объяснил свою задачу, либо строишь огород..
Это время между использования каждой строки? У меня собирает допустим 50 потоков, у нескольких потоков упал прокси, они взяли запасные прокси. Затем другие потоки также могут взять эти прокси через 10-15 минут. А надо каждую строку прокси раз в час.
-
Это время между использования каждой строки?
Да. Но пока это время не пройдёт, следующий поток не сможет получить доступ к ресурсу и будет просто ждать без каких либо действий.
-
@Fox said in Строка из ресурса раз в час.:
Это время между использования каждой строки?
Да. Но пока это время не пройдёт, следующий поток не сможет получить доступ к ресурсу и будет просто ждать без каких либо действий.
Мне такого не надо. Упасть за час может более 50-100 штук прокси. Нужно каждую строку использовать раз в час, а не весь ресурс.
-
@FastSpace Тогда объясни алгоритм действия потока. Упал прокси, берём новый из запаса. Если новый прокси тоже упал, и времени прошло меньше часа, что ему делать?
-
@Fox said in Строка из ресурса раз в час.:
@FastSpace Тогда объясни алгоритм действия потока. Упал прокси, берём новый из запаса. Если новый прокси тоже упал, и времени прошло меньше часа, что ему делать?
Если запасной прокси тоже упал, нужно взять другую строку с другим запасным прокси. А эту строку с запасным прокси (которая упала) также исключить из списка и использовать как положено другим строкам только через час. Использовать нужно 1 строку только раз в час (не важно удачно или нет). А так скрипт сидит и перебирает прокси, где я еще не собрал. Это может занимать времени до 5-7 минут.
-
@FastSpace Что то я запутался..
В любом случае выхода только два, либо в настройках ресурса "время между использованиями", либо через модуль "дата и время". При получении прокси получаешь текущее время, а при повторном обращении ставишь условие, чтобы новое время было больше старого на 3600 секунд (экшен Разница Между Датами возвращает ответ в секундах) -
@Fox said in Строка из ресурса раз в час.:
@FastSpace Что то я запутался..
В любом случае выхода только два, либо в настройках ресурса "время между использованиями", либо через модуль "дата и время". При получении прокси получаешь текущее время, а при повторном обращении ставишь условие, чтобы новое время было больше старого на 3600 секунд (экшен Разница Между Датами возвращает ответ в секундах)Что-то я не понял, как скрипт запомнит нужную строку в ресурсе, да еще и в многопоточном режиме. Доступ к ресурсу должен быть всегда, доступ надо блокировать к строке (или строкам) уже взятым другими потоками в этом часу. Темболее у меня потоки не стоят на месте, а перещелкиваються друг за другом. Переменная просто уже сброситься на ноль. Это наверно надо как-то в список отдельным потоком парсить строки и выдавать по 1 с удалением из списка другим потокам, а через час заново список забирать из текстовика.