Курилка

Moved Other
  • @FastSpace

    Гугл на басе ты регаешь только во сне

    ржу не могу, ты че даже с этой мелочью не освоился ? ну ты школьник конечно ....

  • @Bigma said in Выпущена 28.0.0 версия BrowserAutomationStudio:

    @FastSpace

    Гугл на басе ты регаешь только во сне

    ржу не могу, ты че даже с этой мелочью не освоился ? ну ты школьник конечно ....

    И это я слышу после того ты спрашивал как моб отпечатки отсеить? https://community.bablosoft.com/topic/29313/фильтрация-входящих-отпечатков-в-кастом-сервере

    Ржу не могу здесь только я 🤣

  • @FastSpace ну во первых там есть пример достаточно подробного отсева, ты просто предложил более изящьный, во вторых - там и другие причины есть, когда это было бы удобнее отсекать на стороне баса ...

  • @FastSpace

    Я уже дошёл до скила когда я могу написать свой костыль для бас или перейти на другое решение с написанием своего кода. Чем я уже потихоньку и занимаюсь, да сложно, да муторно, но зато всегда настоящий браузер почти без утечек.

    Вот тупо интересно - что ты там такое пишешь, где прям вот "настоящий браузер" - в пипеторе он прям настоящий ? ты это по виду вкладок понял ?
    Ну ждем релиза - бас от фаста ...

  • Представляете - лет через 5 фаст выпустит свой недо продукт, типо тру браузер ... Вот тогда мы его и похуесосим .... :) а тут не так и вот тут ... Но что-то мне подсказывает, что дальше слов то и не уйдет ...

  • @Bigma для тебя там ничего нет

  • @FastSpace said in Курилка:

    Я уже дошёл до скила когда я могу написать свой костыль для бас или перейти на другое решение с написанием своего кода. Чем я уже потихоньку и занимаюсь, да сложно, да муторно, но зато всегда настоящий браузер почти без утечек.

    В своих решениях - свои костыли :)
    Бас хорош тем, что можно что-то быстро накидать и запустить не открывая ide. Под многие задачи этого более чем достаточно.

    Если нужны изящные решения и нетривиальные подходы - то тут кто как может тот так и пишет :))

    С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).

  • Ребят кто знает как считать текст с PDF? Пробовал с кубиком "Читать файл" но там настолько корявая кодировка выходит. Посоветуйте что можно придумать?

    задача выдернуть из PDF файлов текста.

  • @yooriko посмотри API ocr сервисов. если текст простой - то можешь скриншоты сюда грузить в веб морду (антифрод не сложный). или их апи воспользоваться - кружка кофе дороже будет.

  • This post is deleted!
  • @spam да но в PDF не скан, а обычный текст который скопировать можно, я думаю можно как то его вытянуть его без сторонних сервисов. )?!

  • @yooriko Есть библиотеки которые конвертируют в что то что можно разобрать(json, xml)

  • @DrPrime я пока плохо "дружу" с тем, что нужно кодить. Хоть и есть понимание как их установить и добавить в бас.
    В общем в ходе мониторинга нашлось пару способов.

    1. Можно использовать всякие онлайн OCR сервисы как вы и посоветовали. Но их API лимитировано, а то и платно. Нужно куда-то качать PDF чтобы что-то получить. А PDF бывают разные, может и пара страниц А4 быть весом в 5 метров, а может 300 страниц А3 весом в гектар (просто потому, что какая-то девочка не так сохранила например). Сервисы на любителя. И если куда-то постить файлы, то лучше на PDF24 https://tools.pdf24.org/ru/all-tools у них довольно всё просто и быстро. Вчера прошелся по порядка 10 сервисам и самый точный текст показал именно этот сервис со всякими символами типа "№, $ отличает от S и т.д".
    2. Tesseract OCR или тот же PDF24 (внутри которого Tesseract же и работает) запускать через командную строку. Пока что проблема в том, как прописать batch код чтобы из баса передавался путь в CMD и команда для OCR, а потом забирался распознанный текст прям оттуда же.
      Готовый тесеракт ставить немного проблематично, потому что его нужно подучить, а PDF24 это уже вроде как сделали. :)
    3. Это как говорилось библиотека https://www.npmjs.com/package/node-tesseract-ocr (ну конечно же).

    Если есть знатоки по batch коду сердечно прошу посодействовать.
    Я предпочитаю чтобы всё работало локально по второму способу из-за специфики документов.
    Заранее благодарю.

    Вообще было бы круто добавить в BAS PDF инструменты ))

  • @Bigma said in Курилка:

    @FastSpace меня конечно рефлексит, но вот тут глянул каким был фаст крутым когда-то, тогда он так сильно не выеживался на форуме :)

    Screen Shot 2024-11-20 at 17.52.56.png

    Это было 6.5 лет назад, ты археолог.

  • @spam said in Курилка:

    @FastSpace said in Курилка:

    С полной имитацией устройства, управлением браузера (а там с каждым свои приколы) и хорошими проксями под нужные устройства - тоже не все так просто. Да и сам ты знаешь, что под каждый этот пункт нужно пилить свое решение или допиливать костыли к чужому. (если даже со стороны кажется что там делов на 500 строк кода и все полетит, то это не так...).

    500 ? У меня щас под мои прокси 11500 строк кода на питоне, и то не все случаи закрыл, сегодня коммутатор завис, хотя он 8 мес шпарил стабильно, на днях на умную розетку его подключу и буду в таких случаях ребутать скриптом, библа есть готовая под розетку на гите.

  • @FastSpace про 500 я образно.
    Самописная функция для решения яндекс капчи с ожиданием селекторов, нормальной эмуляцией действий и api capg - только она у меня на 720 строк JS. и это только один тип кликовой капчи.
    Спасибо за подсказку - как правильно отправить задание у кликовой для решения :)

  • продвинутые настройки убрали? Есть только в режиме записи/запуске в самом басе, но после компиляции пропадают(

  • @yume вот эту галочку (Show advanced settings...) при компиляции поставьте:

    image.png

  • @Oyasumi-Punpun стоит такая галочка, да. Перекидываю скомпилированный скрипт на другой пк - там все равно нет продвинутых настроек=(

  • @yume даже после нажатия на эту кнопку?

    tTeIf0M3id.png