@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Есть ли более быстрый способ проверки наличия элемента в списке
-
Нужно периодически проверять некоторое количество ссылок на наличие в списке.
Неполное совпадение тоже считается (например в списке есть example.com/link, значит для example.com/link/1/, example.com/link?x=1&y=2 и т. п. положительный результат, для example.сom/URL - отрицательный)
База данных, normalize URL и модуль список -> "содержит" на точное совпадение, regex намертво вешают BAS, если в списке или очереди на проверку много ссылок. Единственный относительно рабочий - класть весь список в переменную и через if ([[LIST]]).lastIndexOf([[LINK]]) >= 0 проверять, что тоже вешает скрипт, но спустя некоторое время результат все же выдает. Есть ли какой-нибудь более быстрый/надежный способ? -
@adsffdsa можно пробовать сторонние средства не поставляемые в бас.
базы данных, инструменты командной строки, веб/локальные-серверы тп.
можно попробовать реализовать через node.js, пайтон и др. ЯПнапример можно попробовать использовать альтернативные ram db.
-
@adsffdsa said in Есть ли более быстрый способ проверки наличия элемента в списке:
Есть ли какой-нибудь более быстрый/надежный способ?
Если в изначальном списке присутствуют разные домены, можно использовать объект для эффективного разделения и быстрого доступа к ссылкам по доменам. Сначала можно обратиться к объекту по ключу домена, чтобы получить список ссылок для этого домена.
Затем можно применить lastIndexOf для проверки конкретной ссылки.Пример структуры объекта:
const domainLinks = { "example.com": ["example.com/link", "example.com/anotherlink"] };function linkExists(domain, link) { if (!domainLinks[domain]) return false; return domainLinks[domain].lastIndexOf(link) !== -1; } // Пример использования: const domain = "example.com"; const linkToCheck = "example.com/link"; if (linkExists(domain, linkToCheck)) { console.log("Found."); } else { console.log("Not found"); }P.S.
Можно использовать встроенные средства БД для таких запросов, если данные хранятся там.