@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?
-
Привет, подскажите, пожалуйста
Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?ps есть список строк в файле, нужно по одной выбирать, но чтобы потом эта строка снова не попадала в "раздачу". Скрипт может время от времени останавливаться, поэтому пока решил работать именно через файл.
или такой способ "кривой" и даст многовато нагрузки? -
@kuzkuz said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
А как бы вы реализовали?
Базы данных
-
@UserTrue said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
@kuzkuz said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
А как бы вы реализовали?
Базы данных
Короче как я выше написал.. Хорошо. Я попробую импортировать в базу, посмотрю что получится. У отпечатков строки нереально длинные и там куча всяких знаков, не уверен что все будет вытаскиваться потом обратно ровно
-
@UserTrue said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
@kuzkuz said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
А как бы вы реализовали?
Базы данных
Вот думаю может сделать так, чтобы не рисковать потом с правильностью вытаскивания отпечатка с базы обратно.
В базу загнать список строк, просто нумерацию. И в базе отметку ставить какую строку из файла уже брал. С файла только брать строки и не делать с файлом больше ничего.
А в базе ставить отметку или удалять нумерацию которую уже юзал. А? -
@UserTrue said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
@kuzkuz Зачем вообще хранить все отпечатки в одном файле? Не лучше сохранять их в отдельные файлы?
Они и лежат каждый у своего профиля.
-
@UserTrue said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
@kuzkuz Зачем вообще хранить все отпечатки в одном файле? Не лучше сохранять их в отдельные файлы?
На текущий момент у меня есть папки профилей с отпечатками. У каждого свой файл.
Задача. Взять отпечатки и провести некоторый тест. Тысячи профилей. Я собрал список отпечатков в один файл, чтобы далее создавая профили брать последовательно с файла отпечатки.
Если есть идеи другие - подскажи. -
@kuzkuz said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
Ну я в верном направлении думаю, что если отпечаток загонять в базу локальную то потом при выемке и его применении могут возникнуть косяки?
Это от вас зависит.
-
@UserTrue said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
@kuzkuz said in Брать файл (400Мб) в список, выбирать одну строку, возвращать список в файл - так нормально?:
Ну я в верном направлении думаю, что если отпечаток загонять в базу локальную то потом при выемке и его применении могут возникнуть косяки?
Это от вас зависит.
Если я просто импортирую отпечаток в базу а потом вытащу его от туда и применю (как будто из файла - не меняя скрипт). Ответили вы классно. Спасибо.
Ладно, пять голов хорошо, а одна своя ллучше. -
Одного не пойму, а "Получить отпечаток" уже не катит?
По любому надо для разных аккаунтов свой прокси, так что бесплатного ожидания в 3 мин. не будет.
Если уж так приспичило свои отпечатки втыкать, то советую их разбивать поштучно, а скриптом выбирать рандомный с последующим удалением.