Перевести строку в юникод

Поддержка
  • @pragmatik Напишете свою функцию которая будет заменять все символы на юникод. Мне чето лень писать )

  • @denis_krsk а как называется этот тип кодировки, юникодов же несколько (utf-8, utf-16 и т.д.) надо хоть знать как гуглить чтоб понимать что на что менять :)

    А тут вообще такой формат, с которым я не встречался раньше

    \u003ch1\u005csitemprop=\u0022name\u0022\u003e([\u005cs\u005cS]+?)\u003c/h1\u003e
    
  • @pragmatik Эх.. что-то типо того

    var str='<h1\sitemprop="name">([\s\S]+?)</h1>';
    var str =str.replace(/[А-я<>\"\\]/g,function(a){
           return "\\u" + ('000' +a.charCodeAt(0).toString(16)).substr(-4);
    });
    log(str)
    
  • @denis_krsk понятно, значит, кот был почти прав. Щас поэкспериментирую) Благодарю!

  • @pragmatik Ага, почти прав. Только в том варианте символы которые не надо пероводить переводило тоже.

  • @denis_krsk вот я и до сих пор не разберу, какие нужно переводить а какие нет. Какие-нибудь мануалы по юникоду можно почитать чтобы в этом разобраться?

  • @pragmatik Я википедию читал, все вроде понятно. А что переводить, это уже надо самому смотреть.

  • @denis_krsk для моих дел оказалось достаточно функции

        function string_as_unicode_escape(str){
            return str.split("").map(function(s){
                return "\\u"+("0000" + s.charCodeAt(0).toString(16)).slice(-4);
            }).join("");
        }
    

    Несмотря на то, что она переводит в другие символы, БАС и их прекрасно читает, и такие строки удаётся подсунуть ему в коде в качестве регулярки, парсит не хуже.

  • @pragmatik Я что-то не пойму зачем БАСу в таком виде пихать регулярку. Он прекрасно работает без всяких преобразований.

  • @denis_krsk только вот если ты хочешь вводить регулярку из ресурса тебе придётся задействовать код, причём не только код, а ещё и строчку в eval. Потому что просто подставить в код регулярку - не проканает, и точно так же не проканает вставлять эту регулярку в качестве переменной в экшен.

    У меня была задача сделать универсальный парсер где регулярка вводится в ресурс. Вот сделал. Осталось с экспортом базы в csv разобраться.