米兔智能故事机 +关注 已有150人关注 +发表新主题
回复

米兔智能揭秘:语音控制还能这么玩儿?

发表在 公告&活动 08-31 15:33:25  来自PC 复制链接 手机看帖扫一扫!手机看帖更爽 1 390

米兔外表设计简约大方,赢得百万宝宝和爸爸妈妈的喜欢。


你知道吗?米兔高颜值的“大功臣”,是基于儿童自然语言研究的各种智能语音妙用。它为米兔省去了很多密密麻麻的按钮,使得米兔功能操作更加简单轻松。


本期揭秘,我们将一起看看米兔身上,各种有趣的智能语音应用。还有米兔语音功能不断升级幕后,那些好玩的故事。快来看看吧。

简单好玩的语音应用


就像上图中的宝宝那样,问一问米兔,“你饿不饿?”米兔就会回答自己的剩余电量。方便宝宝及时帮米兔充电,安排米兔讲故事的时间,避免玩着玩着没电了的扫兴局面。


语音询问电量,米兔就能即时反馈,不需要爸爸妈妈帮忙通过手机查询电量啦。实现宝宝自己轻松管理和照顾米兔。


自米兔出生以来,智能语音系统不断升级,通过语音能实现的功能操作也越来越多。


大朋友、小朋友们找一找,你还有哪些没用过的语音功能?

儿童语言研究米兔很用心

为什么米兔有时候听不懂?带着问题,我们找到米兔智能语音研究的幕后工程师。


“计算机语言是全世界通用的,但自然语言却因人而异,因文化而异,甚至同一种语言也会因地域而异。”从事人工智能研究的米兔专家级工程师介绍说。


自然语言理解(简称NLP,英文Natural LanguageProcessing的缩写),已经成为人工智能研究中最活跃的领域之一。


据了解,目前世界上NLP研究的主流以英语为主。另一方面,汉语的自然语言数据库只能靠我们中国人自己来做。


由于语法和发声方式都有很大差异,汉语的NLP研究,只能借鉴国外一部分先进研究经验,都要重新积累。而目前国内儿童自然语言研究,就更是处于起步阶段。


在儿童自然语言研究领域,米兔可以说是国内的先行者。


在研究儿童语言的过程中,米兔工程师有很多好玩的发现。


比如,女宝或者一些声音细腻的成年女性唱歌的声音,和男宝的哭声很相像。声音图谱显示,两者的高频振动相似。


这些小发现,是否符合我们平日生活建立起来的常识?


图一、女宝歌声的倒频谱图

图二、男宝哭声的倒频谱图

除了人工智能NLP研究的行业因素,宝宝固有的语音习惯,也是难以识别的重要因素之一。


作为和宝宝问答聊天的小伙伴,米兔必须过滤掉各种不适宜孩童的内容。


但网络上的信息纷繁复杂,很难屏蔽掉那些不适合宝宝听的内容。米兔工程师介绍,米兔的儿童语料库是做加法,把宝宝常用的词句,以关键词的形式添加进去。


统计数据显示,米兔平均每天的语音交互请求量约70万条。这也意味着,每天有70万人次对米兔说话,其中大部分语音来自宝宝。


米兔数据库收到这些语音后,对比现有语料库。能匹配的语音,将即时反馈处理。不能匹配的语音,将打上标签,由工程师们人工识别后扩充到米兔语料库中。


在识别宝宝语言的过程中,工程师们常常被戳中笑点:


“李小兔,灰要我嗦普通话是吧?”


“李小肚,你想吃肉吗?”


 “还有跟你一样的兔子,你小心。”


……

但是,还有很多“火星语”,工程师也表示弄不懂啊。“有时候宝宝的语言,爸爸妈妈连蒙带猜都搞不懂,更别提机器了。”


    因此,宝宝语言的识别和语料库积累,比成人语言研究难度更大,速度也更慢一些。


比如,上面提到的剩余电量询问功能,成人习惯问还有多少电?而宝宝把米兔当做小伙伴,喜欢问米兔饿不饿?


工程师在研发过程中,对宝宝经常使用、符合儿童语音习惯的关键词,会优先加入米兔语料库。


而那些稍微冷僻的词语,暂时没有加入语料库,米兔就听不懂了。


米兔正在做的,是尽量收集丰富宝宝语音数据库,通过不断对比,识别更多的宝宝语言。当然,这个过程肯定是艰难且漫长的。


工程师们正在日夜努力,假以时日,相信米兔一定会越变越聪明哒。

 


米兔揭秘,到这里就告一段落啦。想必大朋友、小朋友们,对米小兔已经有了更多认识。


如果你也有和米兔相伴的故事,或者对米兔的建议,欢迎在留言里分享哦。


言研究米兔很用

扫描二维码,手机查看本帖
发表
最新评论 | 正序排列
只看楼主|楼层直达:
回复