Кодировка не UTF-8



  • Всем привет! Проблема такая. Есть много документов в формате .doc (НЕ .docx), нужно текст как то в BAS передавать. Кодировка не соответствует естественно. Модули в node смотрел, но что то не работает ничего. Может есть у кого то удобное решение?
    Вариант с макросами не подходит. Темы тут смотрел.



  • @IvanG said in Кодировка не UTF-8:

    Всем привет! Проблема такая. Есть много документов в формате .doc (НЕ .docx), нужно текст как то в BAS передавать. Кодировка не соответствует естественно. Модули в node смотрел, но что то не работает ничего. Может есть у кого то удобное решение?
    Вариант с макросами не подходит. Темы тут смотрел.

    Нужен только текст (пофиг на оформление)? Подключать как "ресурс" для многопотока, или просто как файл?



  • @Fox Только текст. На оформление пофиг. Хотел перебрать просто как файлы. Но тоже пофиг на самом деле.



  • @Fox Сделал. Муторно немного, но работает. Через LibreOffice из cmd пересохраняю в .txt Потом из cmd powerShell - ом меняю кодировку на utf8. Bas читает корректно.
    Может пригодится кому нибудь.



  • @IvanG said in Кодировка не UTF-8:

    @Fox Сделал. Муторно немного, но работает. Через LibreOffice из cmd пересохраняю в .txt Потом из cmd powerShell - ом меняю кодировку на utf8. Bas читает корректно.
    Может пригодится кому нибудь.

    Через ноду проще
    https://metanit.com/web/nodejs/2.8.php



  • @Fox Так не получается что то. Вставляю в модуль node.js:

    const fs = require("fs");
    [[TEXT]] = fs.readFileSync("C:\test\test.doc", "utf8");

    Текст не читаемый получается. Не так делаю?



  • @IvanG said in Кодировка не UTF-8:

    Текст не читаемый получается. Не так делаю?

    Эм, он и не будит читаемым, это же бинарный файл. Я как-то находил парсеры doc в html на node. Поищите на github


Log in to reply