Курилка

Moved Other
  • This post is deleted!
  • @spam да но в PDF не скан, а обычный текст который скопировать можно, я думаю можно как то его вытянуть его без сторонних сервисов. )?!

  • @yooriko Есть библиотеки которые конвертируют в что то что можно разобрать(json, xml)

  • @DrPrime я пока плохо "дружу" с тем, что нужно кодить. Хоть и есть понимание как их установить и добавить в бас.
    В общем в ходе мониторинга нашлось пару способов.

    1. Можно использовать всякие онлайн OCR сервисы как вы и посоветовали. Но их API лимитировано, а то и платно. Нужно куда-то качать PDF чтобы что-то получить. А PDF бывают разные, может и пара страниц А4 быть весом в 5 метров, а может 300 страниц А3 весом в гектар (просто потому, что какая-то девочка не так сохранила например). Сервисы на любителя. И если куда-то постить файлы, то лучше на PDF24 https://tools.pdf24.org/ru/all-tools у них довольно всё просто и быстро. Вчера прошелся по порядка 10 сервисам и самый точный текст показал именно этот сервис со всякими символами типа "№, $ отличает от S и т.д".
    2. Tesseract OCR или тот же PDF24 (внутри которого Tesseract же и работает) запускать через командную строку. Пока что проблема в том, как прописать batch код чтобы из баса передавался путь в CMD и команда для OCR, а потом забирался распознанный текст прям оттуда же.
      Готовый тесеракт ставить немного проблематично, потому что его нужно подучить, а PDF24 это уже вроде как сделали. :)
    3. Это как говорилось библиотека https://www.npmjs.com/package/node-tesseract-ocr (ну конечно же).

    Если есть знатоки по batch коду сердечно прошу посодействовать.
    Я предпочитаю чтобы всё работало локально по второму способу из-за специфики документов.
    Заранее благодарю.

    Вообще было бы круто добавить в BAS PDF инструменты ))

  • @Bigma said in Курилка:

    @FastSpace меня конечно рефлексит, но вот тут глянул каким был фаст крутым когда-то, тогда он так сильно не выеживался на форуме :)

    Screen Shot 2024-11-20 at 17.52.56.png

    Это было 6.5 лет назад, ты археолог.

  • @spam said in Курилка:

    @FastSpace said in Курилка:

    С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).

    500 ? У меня щас под мои прокси 11500 строк кода на питоне, и то не все случаи закрыл, сегодня коммутатор завис, хотя он 8 мес шпарил стабильно, на днях на умную розетку его подключу и буду в таких случаях ребутать скриптом, библа есть готовая под розетку на гите.

  • @FastSpace про 500 я образно.
    Самописная функция для решения яндекс капчи с ожиданием селекторов, нормальной эмуляцией действий и api capg - только она у меня на 720 строк JS. и это только один тип кликовой капчи.
    Спасибо за подсказку - как правильно отправить задание у кликовой для решения :)

  • продвинутые настройки убрали? Есть только в режиме записи/запуске в самом басе, но после компиляции пропадают(

  • @yume вот эту галочку (Show advanced settings...) при компиляции поставьте:

    image.png

  • @Oyasumi-Punpun стоит такая галочка, да. Перекидываю скомпилированный скрипт на другой пк - там все равно нет продвинутых настроек=(

  • @yume даже после нажатия на эту кнопку?

    tTeIf0M3id.png

  • @Oyasumi-Punpun да, верно. Там только язык и лог=(

  • @Oyasumi-Punpun только что обратил внимание на настройку "Продвинутые"ab233d0b-e872-45a2-80d5-fbee035ded49-image.png , может её теперь нужно активировать чтоб настройки такие были? У тебя включено?

  • @yume На Продвинутых и должна Галка стоять, при Компиляции скрипта, что бы она работала :)

  • @Alex84 все, все увидел, да, ночью видать совсем невнимателен был) Спасибо вам с @Oyasumi-Punpun, а то я смотрю мышка на "Instal inside AppData..." думал про это имеется ввиду сначала

  • @UserTrue честно говоря, я как пользователь не должен быть в курсе, что консоль вообще чушь собачию показывает, об этом должен быть в курсе суппорт.
    И вот в таком случае я полностью согласен, что пора перестать заниматься игрушками и исправлять однозначно важные вещи.

  • @UserTrue ну фиг знает: вот сделал как ты советовал:
    Screen Shot 2024-11-24 at 02.20.51.png

    обновил и страницу и галочку поставил и еще раз обновил все и в деве и страницу ....

    Видимо сам дев тулс кривой ? или что-то я не понимаю ?

  • @Vituskosoy said in Выпущена 28.1.0 версия BrowserAutomationStudio:

    @Bigma нечего тут развеивать, исправлять пора, особенно теперь, когда в паблик попало.

    Это не имеет смысла править. У меня такого кода ещё много.

    Там СТОЛЬКО всего неправильно работает (более 1000 мест) , что спалить бас можно ещё быстрее чем тебе кажется.

  • @000 у меня такое постоянно, но естессно не на каждом кубике, а только на некоторых в которых есть комментарий.

    Причем на некоторых с существующем комментом есть такая проблема, а на некоторых с существующим комментарием нет проблемы.

    Не знаю с чем это связано.

    Что если в комментах кубика что-то написать или изменить комментарий, то кнопка "ок" не прожимается. Помогает удалить этот кубик и заново создать этот же кубик с ноля.

  • @support так я то только и пытался сообщить о проблеме - провоцирует на оскорблния тут только один чевловек. И то, я в большинстве случаев сдерживаюсь ...