@Fox Привет.Я описывал задачу в этой теме https://community.bablosoft.com/topic/27417/вызов-многопоточной-функции
Дело в том,что я не могу вообще никак перевести свой скрипт на многопоток,у меня тупо,что в вызове функции в многопоток,что просто обычный многопоток,выполняет свою работу с данными по очереди,а не одновременно.И это очень сильно бьет по времени,а нужна именно скорость обработки.Все уже готово и скрипт рабочий полностью,но скорость обработки заставила воспользоваться многопотоком.Ранее,подобных проблем не замечал,а сейчас элементарную задачу не могу уже несколько дней решить.
Скрипт очень простой и работает без браузера вообще,в скрипте используется только одно взаимодействие с гет запросом.Пример скрипта я приложил в этой теме(но без запросов),он точно почти такой же,как и основа.
Логика такова:
1)Запускается скрипт (без всяких ресурсов изначально и данных) и создаются два ресурса.
2)Делается запрос на сайт,который обрабатывается в отдельной функции,т.е. обрабатывает полученные строки и записывает в ресурс.
3)Вызывается функция в несколько потоков,которая работает (должна работать) с каждой строкой из созданного ранее ресурса(уникальной)в отдельном потоке.Данные обрабатываются и записываются во второй ранее созданный ресурс.
4)Как только данные обработаны,ресурс переводится в список и список записывается в файл.Более ничего не делается.
-Сперва я думал,что проблема в создаваемых в ходе работы ресурсах,но нет.Создавал изначально ресурсы и то же самое было.
-Потом пробовал брать из файлов значения\потом создавать файлы по ходу и из них брать данные\сохранять напрямую пытался и.т.д
-Возможно думал стоят какие то ограничения из за слабого пк с 4 гб оперативы и взял сервер с 64 гб,но как обрабатывалась строка за 5 минут на моем пк,так же по скорости и на серваке.Ладно, с этим я уже ничего не поделаю из за регулярок в проекте,согласен.Но вот перевести на поток и хотя бы по 10 строк одновременно обрабатывать,очень бы помогло.А сейчас в любом случае,у меня,сколько бы потоков не выставил - работает все равно как один,просто по очереди разный поток берет свои данные(
Перевести строку в юникод
-
Нужна функция или метод которым можно привести строку регулярки к виду, используемому в коде BAS.
То есть из этого:
<h1\sitemprop="name">([\s\S]+?)</h1>Должно получиться это:
\u003ch1\u005csitemprop=\u0022name\u0022\u003e([\u005cs\u005cS]+?)\u003c/h1\u003eПерепробовал множество функций, ничего не помогает. Так, например, escape() и encodeURIComponent() выдают следующую строку:
%3Ch1%25sitemprop%3D%22name%22%3E%28%5B%25s%25S%5D+%3F%29%3C/h1%3EА мне под мои задачи надо именно как в BAS:
\u003ch1\u005csitemprop=\u0022name\u0022\u003e([\u005cs\u005cS]+?)\u003c/h1\u003e -
@pragmatik Напишете свою функцию которая будет заменять все символы на юникод. Мне чето лень писать )
-
@denis_krsk а как называется этот тип кодировки, юникодов же несколько (utf-8, utf-16 и т.д.) надо хоть знать как гуглить чтоб понимать что на что менять :)
А тут вообще такой формат, с которым я не встречался раньше
\u003ch1\u005csitemprop=\u0022name\u0022\u003e([\u005cs\u005cS]+?)\u003c/h1\u003e -
@pragmatik Эх.. что-то типо того
var str='<h1\sitemprop="name">([\s\S]+?)</h1>'; var str =str.replace(/[А-я<>\"\\]/g,function(a){ return "\\u" + ('000' +a.charCodeAt(0).toString(16)).substr(-4); }); log(str) -
@pragmatik Ага, почти прав. Только в том варианте символы которые не надо пероводить переводило тоже.
-
@pragmatik Я википедию читал, все вроде понятно. А что переводить, это уже надо самому смотреть.
-
@denis_krsk для моих дел оказалось достаточно функции
function string_as_unicode_escape(str){ return str.split("").map(function(s){ return "\\u"+("0000" + s.charCodeAt(0).toString(16)).slice(-4); }).join(""); }Несмотря на то, что она переводит в другие символы, БАС и их прекрасно читает, и такие строки удаётся подсунуть ему в коде в качестве регулярки, парсит не хуже.
-
@pragmatik Я что-то не пойму зачем БАСу в таком виде пихать регулярку. Он прекрасно работает без всяких преобразований.
-
@denis_krsk только вот если ты хочешь вводить регулярку из ресурса тебе придётся задействовать код, причём не только код, а ещё и строчку в eval. Потому что просто подставить в код регулярку - не проканает, и точно так же не проканает вставлять эту регулярку в качестве переменной в экшен.
У меня была задача сделать универсальный парсер где регулярка вводится в ресурс. Вот сделал. Осталось с экспортом базы в csv разобраться.