语言是人类社交活动的一种传播媒介,人通过语言进行沟通交流。语言交流是人类一种天然的沟通模式。从儿童时代开始我们对语言的相关学习都是自发的,语言交流始终贯穿于我们的生活。它是那么的自然以至于我们根本没有发现这是一种多么复杂的现象。人类的声道和发音器官,是具有非线性特征的生物器官,不仅仅运行在有意识的控制下,而且受到性别及其成长因素情绪状态的影响。
我们知道当声音通过媒介传到人的耳朵里,大脑会对语音进行处理并形成自己的理解,然后用语言或者行动应答。那么计算机是如何听懂人类语言的?这就要靠人机交互的重要技术——语音识别技术。

语音识别技术发展至今,在识别精度上已经达到了相当高的水平。尤其是中小词汇量对非特定人语音识别系统识别精度已经大于98%,而对特定人语音识别精度更高。现如今的语音识别准确度已经能够满足人们日常应用的需求,很多手机、智能音箱、智能翻译机、电脑都已经带有语音识别功能,十分便利。
近日Google宣布将扩大对30种新语言和方言的语音到文本的支持,从而使全球范围内的更多人仅使用语音即可键入,翻译和搜索。从现在开始,Google的Cloud Speech API可以将口语单词转换为以下语言的文本,从而使支持的方言总数达到119。
接下来,Google会将其最新语言应用于其他应用程序,例如Google Translate和其Gboard附加组件,不仅可以进行语音识别,而且还可以立即为新添加的语言进行即时翻译和语音搜索。也就是说,可以从字面上说“太阳镜表情符号”,在其文字中加上太阳镜装饰的笑脸–对于那些难以找到'100'符号的人来说,这是一个方便的功能,而Google计划将其扩展为其他语言不久。
文章部分来源:华夏模具网
