解决方法
从几个月看这些问题,我看到大多数开发人员的选择分解如下:
Windows人员 – 使用.Net或Microsoft.Speech的System.Speech功能,并安装Microsoft提供的免费识别器. Windows 7包括一个完整的语音引擎.其他可免费下载.有一个称为SAPI的相同引擎的C API.请参阅http://msdn.microsoft.com/en-us/magazine/cc163663.aspx.或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx.有关Windows引擎的更多背景
What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?
Linux人物 – 狮身人面像似乎有很好的追随者.见http://cmusphinx.sourceforge.net/和http://cmusphinx.sourceforge.net/wiki/
商业产品 – Nuance,Loquendo,AT&T,IBM等.每个都提供各种各样的语言的SDK和库.
在线服务 – Nuance,Yapme,ispeech.org,vlingo等. Nuance改进了开发人员计划,现在将为您提供free access to their services开发. Yap(我相信)最近是purchased by Amazon,所以我们可能会看到一些变化.
当然这也可能是有帮助的 – http://en.wikipedia.org/wiki/List_of_speech_recognition_software
有一个Java语音API.请参阅Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html中的javax.speech.recognition.我相信您仍然必须找到支持该API的语音引擎.我不认为狮身人面像完全支持它 – http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi
还有很多其他的问题:
Need text to speech and speech recognition tools for Linux
和pyspeech (python) – Transcribe mp3 files?,谈到http://code.google.com/p/pyspeech/.你可能还想看看http://code.google.com/p/dragonfly/