@sergerdn Чтобы получилось 60 fps и получилось нормально
Нужно на RDP включить режим 60 кадров в реестре, по умолчанию там 30. Включить 60 кадров в настройках BAS. Крутить скрипт на сервере, так чтобы не перегружать системные ресурсы. Чем выше нагрузка, тем больше браузер/винда браузеру (?) сбрасывает кадров, чтобы сохранить тот самый многопоток когда упор идет в процессор например.А возможно ли ? (Решение аудио капчи)
-
@Ivan Без танцев с бубном нет. Это апи поддерживает только ввод с микрофона. Лучше попробовать какой-то движок для десктопа или апи, который принимает файлы.
Чтобы потестить, я скачал несколько аудио файлов с второй рекапчи, скачал pocketsphinx и ffmpeg. Конвертировал mp3 в wav
ffmpeg -i audio.mp3 -acodec pcm_s16le -ac 1 -ar 16000 out.wavВзял простенькую грамматику
#JSGF V1.0; grammar digits; <digit> = oh | zero | one | two | three | four | five | six | seven | eight | nine ; public <digits> = <digit>+;И запустил определение с такими параметрами
pocketsphinx_continuous -infile output.wav -hmm model\en-us\en-us -dict model\en-us\cmudict-en-us.dict -jsgf digits.gram > res.txtВ результате, в файле res.txt обычно оказывалась половина правильных цифр, так что потенциал есть.
Ну и БАС можно все это использовать через Запустить Процесс. -
@Garex22 Через webkitSpeechRecognition затруднительно. Он не работает с файлами. Я пробовал микрофон приставить к колонкам - определились левые слова. Через консольные приложение - вполне возможно. Еще есть google speech api, возможно другие аналоги.