语音识别有哪些开放的开发平台?
1)微软语音API微软的语音API(简称SAPI)是一个应用编程接口(API),它包括语音识别(SR)和语音合成(SS)引擎,在Windows下被广泛使用。目前微软已经发布了几个版本的SAPI(最新版本是SAPI 5.4),要么作为Speech SDK的开发工具包发布,要么直接包含在windows操作系统中。SAPI支持多种语言的识别和阅读,包括英语、中文和日语。
2).IBM viaVoiceIBM是较早开始语音识别研究的机构之一。早在20世纪50年代末,IBM就开始了语音识别的研究。计算机被设计用来检测特定的语言模式,并获得声音和相应字符之间的统计相关性。1999年,IBM发布了VoiceType的免费版本。2003年,IBM基于生存能力授权ScanSoft拥有桌面产品的独家经销权,随后ScanSoft与Nuance合并。现在生存能力早已淡出人们的视线,取而代之的是细微差别。
3)NuanceNuance communication是一家跨国计算机软件技术公司,总部位于美国马萨诸塞州伯灵顿,主要提供语音和图像解决方案及应用。目前业务集中在服务器和嵌入式语音识别、电话转向系统、自动电话号簿服务等。除了语音识别技术,Nuance语音技术还包括语音合成、声纹识别等技术。在世界语音技术市场上,80%以上的语音识别采用了Nuance识别引擎技术,其名下拥有超过1000项专利技术。该公司开发的语音产品可以支持50多种语言,在全球拥有超过20亿用户。Nuance的语音识别服务应用在苹果iPhone 4S的Siri语音识别中。
4)作为国内最大的智能语音技术提供商,科大讯飞科大讯飞在智能语音技术领域有着长期的研究和积累,在中文语音合成、语音识别、口语评测等技术方面拥有国际领先的成果。占据中国语音技术市场60%以上的份额,语音合成产品市场份额达到70%以上。
5)其他有影响力的商业语音交互平台包括谷歌的语音搜索、百度和搜狗的语音输入法等。