Ocr free web



  • Ищу помощь в данной теме.
    Есть соображение:
    расширение ocr для chrome , например эти 2 copyfish и naptha они могут выделенные изображения на страницы переводить в текст (аля ABBYY FineReaderr).
    Была уже создана тема Как посмотреть исходный код любого расширения в браузере .
    Собственно как имея исходный код , подправить его для бас : берем капчу и переводим её в текст.Капча простая, однотонный фон и на нем 2 цифры. Пробывал закидывать картинку на google doc , 95 из 100 капч распознавала верно, это и натолкнуло на версию с web ocr .
    Может есть вариант как слать капчу на google doc ? Какая там ocr ?Буду благодарен за помощь.



  • @Penter не считаю что нужно что-то там выколупывать из расширений этих.
    можно просто загуглить онлайн сервисы https://www.google.com/search?q=online+ocr без капч и прочего, что норм распознают и отправлять им.

    можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

    можно использовать консольные утилиты ocr https://www.google.com/search?q=ocr+windows+console Чтобы баз вызывал командную строку запускал команду с нужными аргументами и получал output из консоли (ответ, результат работы утилиты).
    Этот считается вроде как самым лучшим среди free https://github.com/tesseract-ocr/tesseract
    Только тут нужно уточнять момент у @support может ли бас получать доступ к потоку вывода консоли. Скорее всего да,
    alt text
    но самому еще доводилось использовать.



  • У меня был один проект из двух скриптов, первый выполнял основные задачи и когда нарывался на капчу делал скрин (из кэша не получалось вытащить, не помню по какой причине) и делал текстовую запись в файл 1.txt (например), второй скрипт в это время мониторил каждые 5 сек. этот файл, как только получал команду к старту из файла - брал скрин и грузил его на to-textточкаnet (там ребята из Литовского, кажется, университета, разработали очень хороший OCR), обрабатывал, получал результат, записывал его в файл 2.txt, который в это время мониторил первый скрипт, он получал результат вводил его и в зависимости от того правильно решена капча или нет - делал соответствующую запись в 1.txt.

    Если фейл - команда на повторение цикла, если вин - второй скрипт падает в ожидание, первый продолжает работу...

    ...потом я понял, что занимаюсь ерундой, а в это время старею! Купил Монстра, обучил его, погрохал те скрипты и зажил счастливо.) (только СолвеМедиа аудио для Монстра не хватает в BAS)

    Если хотите продолжить работу в том же направлении советую испытать сайт, у меня были очень хорошие результаты разгадывания.

    P.S. - С Tesseract-OCR приемлемых результатов мне добиться не удалось, слишком много ошибок было.



  • @wodopad Capmonster demo, я с чего подумал что он настолько же ущербно урезан и как и постер, но к счастью это не так. Ограницения мне с головой хватает. Теперь другая запара, как натренеровать модуль для решения капчи. Порыл гугл нашел умельцев что уже это сделалали, но один с концами пропал, второго буду связь искать.



  • @out

    @out said

    @Penter не считаю что нужно что-то там выколупывать из расширений этих.
    можно просто загуглить онлайн сервисы https://www.google.com/search?q=online+ocr без капч и прочего, что норм распознают и отправлять им.

    можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

    можно использовать консольные утилиты ocr https://www.google.com/search?q=ocr+windows+console Чтобы баз вызывал командную строку запускал команду с нужными аргументами и получал output из консоли (ответ, результат работы утилиты).
    Этот считается вроде как самым лучшим среди free https://github.com/tesseract-ocr/tesseract
    Только тут нужно уточнять момент у @support может ли бас получать доступ к потоку вывода консоли. Скорее всего да,
    alt text
    но самому еще доводилось использовать.

    пробывал этотвариант, одни минусы, да и знание не полны по вопросу, capmonster решает все на раз два



  • @out

    можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

    Вот тут бы поподробнее



  • @Penter http://www.telerik.com/fiddler сниффер, анализор трафика.



  • @Penter ох не знаю.. использовать капмонстр для OCR капч не совсем правильно. Он разрабатывался для более сложных каптч. А не таких, что ровные буквы, одинаковые да еще и на одном чистом фоне.



  • @out так задача выполняется с успехоп 100п роцентов, я еще его использую на audio recaptcha2 + recaptcha



  • @Penter said in Ocr free web:

    Теперь другая запара, как натренеровать модуль для решения капчи. Порыл гугл нашел умельцев что уже это сделалали, но один с концами пропал, второго буду связь искать.

    У разработчиков, отличные видеоинструкции по обучению модулей. В первые разы придётся повозиться, конечно, потом быстрее будет получаться.

    Важно, что нужно подготовить большое количество изображений капчи (я стараюсь использовать не менее 200), но когда у нас есть BAS - собрать их не проблема. ;)

    Если нужно, напишите в личку, подкину исходник бота (накидал когда проверял подойдёт ли мне монстр) решающего задачку которая выскакивает каждые 10 минут в демке, чтоб не париться с этим вручную.

    @out said in Ocr free web:

    @Penter ох не знаю.. использовать капмонстр для OCR капч не совсем правильно. Он разрабатывался для более сложных каптч. А не таких, что ровные буквы, одинаковые да еще и на одном чистом фоне.

    Если это эффективно - почему нет?


Log in to reply