А возможно ли ? (Решение аудио капчи)

Поддержка
  • Возможно ли с помощью- ЭТОГО -организовать решение аудио-капчи ??

  • @Ivan Без танцев с бубном нет. Это апи поддерживает только ввод с микрофона. Лучше попробовать какой-то движок для десктопа или апи, который принимает файлы.

    Чтобы потестить, я скачал несколько аудио файлов с второй рекапчи, скачал pocketsphinx и ffmpeg. Конвертировал mp3 в wav
    ffmpeg -i audio.mp3 -acodec pcm_s16le -ac 1 -ar 16000 out.wav

    Взял простенькую грамматику

    #JSGF V1.0;
    
    grammar digits;
    
    <digit> = oh    |
              zero  |
              one   |
              two   |
              three |
              four  |
              five  |
              six   |
              seven |
              eight |
              nine  ;
    
    public <digits> = <digit>+;
    

    И запустил определение с такими параметрами

    pocketsphinx_continuous -infile output.wav -hmm model\en-us\en-us -dict model\en-us\cmudict-en-us.dict -jsgf digits.gram > res.txt
    

    В результате, в файле res.txt обычно оказывалась половина правильных цифр, так что потенциал есть.
    Ну и БАС можно все это использовать через Запустить Процесс.

  • Что, такое действительно возможно?

  • @Garex22 Через webkitSpeechRecognition затруднительно. Он не работает с файлами. Я пробовал микрофон приставить к колонкам - определились левые слова. Через консольные приложение - вполне возможно. Еще есть google speech api, возможно другие аналоги.

  • 0 Votes
    3 Posts
    399 Views
  • 0 Votes
    5 Posts
    597 Views
  • 0 Votes
    7 Posts
    1098 Views
  • 0 Votes
    3 Posts
    3479 Views
  • 1 Votes
    6 Posts
    2266 Views