Считывание PDF

Поддержка
  • Вопрос к знатокам, как правильно считать PDF. Через модуль - "читать файл" в переменную падает битая кодировка на кириллице, следственно при сохранение данных из переменной в фаил.pdf, имеем битый документ.
    Как и чем можно правильно считать документ с вкраплениями бинарных данных?

  • @BabloUser Попробуй читать в base64

  • @fox сработало, благодарю !

  • Теперь новая трабла.

    Нужно эту пдфку в base64 залить на сервер в расшифрованом виде, нужно что бы в пост дате данные из пдф выглядели в чистом виде без лишних параметров
    пробывал считывать как фаил, разницы нет, цепляет

    так и не понял откуда берутся эти данные если в этом поле
    HTTP-Клиент Сброс - перед отправкой пост запроса пробывал, не помогло...
    Господа, где зарыта сабака ? Что я не так делаю?

  • @BabloUser Где то я видел твой вопрос уже.. Но когда освободился, не смог найти пост :D

    Попробуй так

    "","data:application/pdf;base64//" + [[FILE_CONTENT]]
    

    Либо прочитать тут

  • @fox нее, первый раз столкнулся с этим. Ест похожий во тут https://community.bablosoft.com/topic/3607/http-post-multipart-form-data/7

    все перепробовал оттуда, в моем случае не помогает увы (

    "","data:application/pdf;base64//" + [[FILE_CONTENT]]
    

    на сервер ушло все закодированое в base64
    если фаил не читать в base64 уходит в битой кодировке
    и так же с левыми данными

  • @BabloUser Не совсем понимаю, что нужно в итоге и что не получается. Можешь сохранить из base64 в обычный файл с расширением .pdf, и добавить в запрос именно файл

  • @fox как его добавить? пробывал в конструкторе добавить как фаил и указывал в переменной путь к файлу в результате пост запрос пустой. Может как то я не правильно его добавляю?

    Всего лишь нужно отправить НЕБИТЫЙ фаил pdf на сервер, как в 4 комменте от меня, на первом скрине, в post date только лишь данные пдфки без лишнего мусора.

  • @BabloUser Тебе по факту нужно отправить pdf файл.. И в чём проблема? Скинь тестовый скрипт, а то мы долго будем рассуждать.

  • @fox его не отправить а хеш нужно получить, сейчас минутку, я скину проект.

  • @fox
    А был чистый скажем так бинарный фаил пдф. Иначе хеш будет отличаться от оригинального пдф дока.

  • @BabloUser Бред, но я тоже не смог закинуть сюда скрипт..

    Мне бы как нибудь тестировать успешность манипуляций :D
    Вот так должно работать:
    https://ru.files.fm/u/fr744mfh

  • @fox оно работать то работает, вся соль в том что в данных которые отправляются находятся лишние данные только в этом единственном трабл больше нигде.

  • Кто поможет мне, получит от меня спасибо в очень огромном материальном виде.
    Как вообще можно считать фаил в переменную, в той кодировке в какой он есть, может как то через JS ?

  • @BabloUser

    Как вообще можно считать фаил в переменную, в той кодировке в какой он есть, может как то через JS ?

    JS вообще не имеет доступа к файлам. Как понять кодировка файла?? Есть понятие кодировка текста. Исполняемый файл открывается правильно благодаря расширению.

    Кто поможет мне

    А ты скинь способ проверки успешности манипуляций

  • @fox said in Считывание PDF:

    способ проверки успешности манипуляций

    не понимаю о чем ты, поконкретнее пожалуйста.

  • @BabloUser

    поконкретнее пожалуйста.

    Как ты понимаешь, что отправить файл не получается. Как, допустим, мне понять что файл я отправил правильно?

  • @fox post data это те данные это то что ушло на сервер, они должны уходить в чистом виде тоесть то что содержится в файле pdf вместе с бинарными вкраплениями

  • @bablouser

    Как вообще можно считать фаил в переменную, в той кодировке в какой он есть, может как то через JS ?

    Это нужная фича, но я не думаю, что это поможет в вашем случае.
    BAS хранит данные в виде текста в своей кодировке или в виде бинарных данных как base64.
    Если сделать чтение файла из заданной кодировки, то кодировка строки в БАС не изменится от этого.
    Да и файл у вас бинарный, поэтому тут тлько использовать base64.

    Я так понимаю, что основная - это необходимость убрать Content-Type?

  • @support да верно, нужно отправить только лишь бинарную часть pdf