Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
Здраствуйте, подскажите пожалуйста как через BAS распознать текс в PDF файле или переменной?
Через ocr. Так как текст просто так не выдернуть, это делается специальной нейронкой. Можно самому отправить запросы на какой-нибудь сервис, можно юзать готовый npm модуль или локальный сервер
@Q_Q said in Распознание PDF:
Так как текст просто так не выдернуть, это делается специальной нейронкой
Если pdf это не просто скрин то вполне можно выдернуть, есть npm пакеты
@mikivin можно через Nodejs, можете тут поискать пакеты https://npms.io/search?q=pdf
Я очень давно пользовался pdfreader , возможно есть что-то удобней сейчас
да пробовала через Nodejs разные варианты, может кто сейчас работает с PDF и знает как настроить?
@Fox Большое спасибо, все работает!
@Ivanuvelirrrr said in Imap file pdf image:
@Fox Так ты знаешь можно ли такое в басе делать?
Можно используя ноду и соответствующую библиотеку. Возможно получиться и через curl, в БАС есть curl wrapper https://www.dropbox.com/sh/54kii8r85e5y5qt/AADujFuoeSw0ps4_43750rmsa?dl=0
в npm есть либа https://www.npmjs.com/package/pdf-parse, подключить ее и выполнить код в Nodejs.
@Kroner Лог запуска ноды в студию! Шарящие люди, может, помогут вам эти модули нормально запустить
@uraabk
Это закрытая CRM система.
Без каких либо данных сайта я ни чего не могу сделать.
Подскажите, может есть еще способ?
Попробуй снифать запросы, должен быть запрос на формирования этого PDF файла, выйдет надёжнее и быстрее, чем через браузер.