up
Курилка
-
@DrPrime я пока плохо "дружу" с тем, что нужно кодить. Хоть и есть понимание как их установить и добавить в бас.
В общем в ходе мониторинга нашлось пару способов.- Можно использовать всякие онлайн OCR сервисы как вы и посоветовали. Но их API лимитировано, а то и платно. Нужно куда-то качать PDF чтобы что-то получить. А PDF бывают разные, может и пара страниц А4 быть весом в 5 метров, а может 300 страниц А3 весом в гектар (просто потому, что какая-то девочка не так сохранила например). Сервисы на любителя. И если куда-то постить файлы, то лучше на PDF24 https://tools.pdf24.org/ru/all-tools у них довольно всё просто и быстро. Вчера прошелся по порядка 10 сервисам и самый точный текст показал именно этот сервис со всякими символами типа "№, $ отличает от S и т.д".
- Tesseract OCR или тот же PDF24 (внутри которого Tesseract же и работает) запускать через командную строку. Пока что проблема в том, как прописать batch код чтобы из баса передавался путь в CMD и команда для OCR, а потом забирался распознанный текст прям оттуда же.
Готовый тесеракт ставить немного проблематично, потому что его нужно подучить, а PDF24 это уже вроде как сделали. :) - Это как говорилось библиотека https://www.npmjs.com/package/node-tesseract-ocr (ну конечно же).
Если есть знатоки по batch коду сердечно прошу посодействовать.
Я предпочитаю чтобы всё работало локально по второму способу из-за специфики документов.
Заранее благодарю.Вообще было бы круто добавить в BAS PDF инструменты ))
-
@FastSpace said in Курилка:
С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).
500 ? У меня щас под мои прокси 11500 строк кода на питоне, и то не все случаи закрыл, сегодня коммутатор завис, хотя он 8 мес шпарил стабильно, на днях на умную розетку его подключу и буду в таких случаях ребутать скриптом, библа есть готовая под розетку на гите.
-
@FastSpace про 500 я образно.
Самописная функция для решения яндекс капчи с ожиданием селекторов, нормальной эмуляцией действий и api capg - только она у меня на 720 строк JS. и это только один тип кликовой капчи.
Спасибо за подсказку - как правильно отправить задание у кликовой для решения :) -
@yume вот эту галочку (
Show advanced settings...) при компиляции поставьте:
-
@Oyasumi-Punpun стоит такая галочка, да. Перекидываю скомпилированный скрипт на другой пк - там все равно нет продвинутых настроек=(
-
@yume даже после нажатия на эту кнопку?

-
@Oyasumi-Punpun да, верно. Там только язык и лог=(
-
@Oyasumi-Punpun только что обратил внимание на настройку "Продвинутые"
, может её теперь нужно активировать чтоб настройки такие были? У тебя включено? -
@UserTrue честно говоря, я как пользователь не должен быть в курсе, что консоль вообще чушь собачию показывает, об этом должен быть в курсе суппорт.
И вот в таком случае я полностью согласен, что пора перестать заниматься игрушками и исправлять однозначно важные вещи. -
@Vituskosoy said in Выпущена 28.1.0 версия BrowserAutomationStudio:
@Bigma нечего тут развеивать, исправлять пора, особенно теперь, когда в паблик попало.
Это не имеет смысла править. У меня такого кода ещё много.
Там СТОЛЬКО всего неправильно работает (более 1000 мест) , что спалить бас можно ещё быстрее чем тебе кажется.
-
@000 у меня такое постоянно, но естессно не на каждом кубике, а только на некоторых в которых есть комментарий.
Причем на некоторых с существующем комментом есть такая проблема, а на некоторых с существующим комментарием нет проблемы.
Не знаю с чем это связано.
Что если в комментах кубика что-то написать или изменить комментарий, то кнопка "ок" не прожимается. Помогает удалить этот кубик и заново создать этот же кубик с ноля.
-
@FastSpace ну вот зачем ты опять себя закапываешь ? 1000 способов наверняка у тебя уже записаны .... Какие пдф ? ты че несешь ? давай в ворде хотя бы ...
И давай уже мух от котлет отделим - есть браузер ( это как бы браузер и тру он может быть только на хроме на винде), а дальше псевдо эмуляция на мобилах ...
Есть притензии по браузеру хром на винде или все ? Тысячи там заканчиваются или нет ?
А вот по мобилам можно и отдельно поговорить, ведь правда ? -
@Bigma said in Выпущена 28.1.0 версия BrowserAutomationStudio:
@FastSpace ну вот зачем ты опять себя закапываешь ? 1000 способов наверняка у тебя уже записаны .... Какие пдф ? ты че несешь ? давай в ворде хотя бы ...
И давай уже мух от котлет отделим - есть браузер ( это как бы браузер и тру он может быть только на хроме на винде), а дальше псевдо эмуляция на мобилах ...
Есть притензии по браузеру хром на винде или все ? Тысячи там заканчиваются или нет ?
А вот по мобилам можно и отдельно поговорить, ведь правда ?Это вместе с андройд, без него поменьше конечно будет, 250+
-
@FastSpace said in
Это вместе с андройд, без него поменьше конечно будет, 250+
давай по ступенькам - 250 по браузеру на винде хрому - и потихоничку все исправим ...

