No.002 人と技術はどうつながるのか?
主题
技术

语音识别技术将走向何方?

超越用户界面,走向人工智能和代理

  • 2012.07.09
  • 作者:山路达也

利用语音识别技术的用户界面(例如 iPhone 上的 Siri)正在引起人们的关注。新技术正在开发和应用,例如使用大数据来加速语音识别处理以及根据语音状态理解情绪和压力的能力。为什么现在要进行语音识别?在回顾迄今为止的发展和研究历史的同时,我们将探索日益受到关注的语音识别的可能性。

用公式对人类语音进行建模

语音输入界面正在迅速引起人们的关注。

在日本,自 20 世纪 90 年代起,PC 语音输入软件就已上市,Docomo 还发布了一款可以使用语音识别搜索电话号码簿的手机设备,但我认为人们对此谈论得不多。

在美国,自 20 世纪 90 年代起,使用语音识别技术的产品和服务就已广泛普及,但对普通大众来说,突破性的产品可能是安装在苹果 iPhone 中的 Siri。只需对着 iPhone 说话,您就可以轻松输入日程、发送消息、搜索网络等。如果你问 Siri 什么是“生命”,她会告诉你“42”(科幻小说《银河系漫游指南》中的一个著名笑话)。用户似乎很欣赏 Siri 聪明但又有点古怪的性格。

1987 年,Apple 宣布了一种名为“知识导航器”的未来信息设备概念,一些用户对 Siri 的体现感到兴奋。

Android 还拥有 Google Voice Action,可让您通过语音控制智能手机,而且 Siri 等个人助理应用也已出现。移动Google搜索应用程序还具有语音搜索功能。

使用语音自由控制数字设备已经成为现实,感觉我们距离人工智能的出现只有几天的时间了。

是否有某种突破性的进展让从未真正流行起来的语音识别用户界面受到如此关注?

版权©2011-