/
Курилка
-
@FastSpace ну во первых там есть пример достаточно подробного отсева, ты просто предложил более изящьный, во вторых - там и другие причины есть, когда это было бы удобнее отсекать на стороне баса ...
-
Я уже дошёл до скила когда я могу написать свой костыль для бас или перейти на другое решение с написанием своего кода. Чем я уже потихоньку и занимаюсь, да сложно, да муторно, но зато всегда настоящий браузер почти без утечек.
Вот тупо интересно - что ты там такое пишешь, где прям вот "настоящий браузер" - в пипеторе он прям настоящий ? ты это по виду вкладок понял ?
Ну ждем релиза - бас от фаста ... -
Представляете - лет через 5 фаст выпустит свой недо продукт, типо тру браузер ... Вот тогда мы его и похуесосим .... :) а тут не так и вот тут ... Но что-то мне подсказывает, что дальше слов то и не уйдет ...
-
@FastSpace said in Курилка:
Я уже дошёл до скила когда я могу написать свой костыль для бас или перейти на другое решение с написанием своего кода. Чем я уже потихоньку и занимаюсь, да сложно, да муторно, но зато всегда настоящий браузер почти без утечек.
В своих решениях - свои костыли :)
Бас хорош тем, что можно что-то быстро накидать и запустить не открывая ide. Под многие задачи этого более чем достаточно.Если нужны изящные решения и нетривиальные подходы - то тут кто как может тот так и пишет :))
С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).
-
This post is deleted!
-
@DrPrime я пока плохо "дружу" с тем, что нужно кодить. Хоть и есть понимание как их установить и добавить в бас.
В общем в ходе мониторинга нашлось пару способов.- Можно использовать всякие онлайн OCR сервисы как вы и посоветовали. Но их API лимитировано, а то и платно. Нужно куда-то качать PDF чтобы что-то получить. А PDF бывают разные, может и пара страниц А4 быть весом в 5 метров, а может 300 страниц А3 весом в гектар (просто потому, что какая-то девочка не так сохранила например). Сервисы на любителя. И если куда-то постить файлы, то лучше на PDF24 https://tools.pdf24.org/ru/all-tools у них довольно всё просто и быстро. Вчера прошелся по порядка 10 сервисам и самый точный текст показал именно этот сервис со всякими символами типа "№, $ отличает от S и т.д".
- Tesseract OCR или тот же PDF24 (внутри которого Tesseract же и работает) запускать через командную строку. Пока что проблема в том, как прописать batch код чтобы из баса передавался путь в CMD и команда для OCR, а потом забирался распознанный текст прям оттуда же.
Готовый тесеракт ставить немного проблематично, потому что его нужно подучить, а PDF24 это уже вроде как сделали. :) - Это как говорилось библиотека https://www.npmjs.com/package/node-tesseract-ocr (ну конечно же).
Если есть знатоки по batch коду сердечно прошу посодействовать.
Я предпочитаю чтобы всё работало локально по второму способу из-за специфики документов.
Заранее благодарю.Вообще было бы круто добавить в BAS PDF инструменты ))
-
@FastSpace said in Курилка:
С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).
500 ? У меня щас под мои прокси 11500 строк кода на питоне, и то не все случаи закрыл, сегодня коммутатор завис, хотя он 8 мес шпарил стабильно, на днях на умную розетку его подключу и буду в таких случаях ребутать скриптом, библа есть готовая под розетку на гите.
-
@FastSpace про 500 я образно.
Самописная функция для решения яндекс капчи с ожиданием селекторов, нормальной эмуляцией действий и api capg - только она у меня на 720 строк JS. и это только один тип кликовой капчи.
Спасибо за подсказку - как правильно отправить задание у кликовой для решения :) -
@yume вот эту галочку (
Show advanced settings...) при компиляции поставьте:
-
@Oyasumi-Punpun стоит такая галочка, да. Перекидываю скомпилированный скрипт на другой пк - там все равно нет продвинутых настроек=(
-
@yume даже после нажатия на эту кнопку?

-
@Oyasumi-Punpun да, верно. Там только язык и лог=(
-
@Oyasumi-Punpun только что обратил внимание на настройку "Продвинутые"
, может её теперь нужно активировать чтоб настройки такие были? У тебя включено?
