您的位置 首页 智能家居

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

截至2019年6月,小爱同学日活接近五千万,连接设备多达1.96亿台;截至11月14日,小爱同学唤醒次数达到341亿次。

副标题#e#

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

智东西(公众号:zhidxcom)
文| 李水青

智东西11月21日消息,昨天,在MIDC大会“小米AI生态峰会暨小爱同学3.0发布会”分论坛上,小米语音首席科学家、国际著名开源语音识别工具Kaldi创始人Daniel Povey首次公开亮相,并分享了其下一代Kaldi计划。

小米人工智能部副总经理、小爱团队负责人王刚告诉智东西记者,小爱同学使用的语音技术本来就来自于Daniel开源的软件,Daniel的加盟将加大小米在Kaldi上的优势。接下来Daniel将主要参与“语音识别问题”的技术研发,涉及中英文混杂识别、方言识别等方面的问题。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

同时,小爱同学3.0版正式发布,据介绍,3.0版是首个在手机上实现自然连续对话的语音助理,具有全双工自然连续对话、AI电话助理、男生版小爱同学等功能。

据统计,目前已有七大场景、40多类设备内置了小爱同学。截至2019年6月,小爱同学日活接近五千万,连接设备多达1.96亿台;截至11月14日,小爱同学唤醒次数达到341亿次。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

除此之外,小米AI实验室主任NLP首席科学家王斌也首次面向公众,与小米公司的其它研发人员讲解了小米AI在视觉、语音、声学算法、自然语言处理、知识图谱、机器学习六大方向的进展。

一、“小米不是营销公司”,多年坚持“C-B-A”发展路线

小米集团副总裁、集团技术委员会主席崔宝秋说,近来,有人将小米定位为“营销公司”、“硬件组装公司”,这是对小米极大的误解。

崔宝秋介绍,小米自2012年以来坚持“C-B-A”发展路线,首先发力云平台,之后扩展到大数据和人工智能。2016年,小米将人工智能作为重点发展方向,一直将“AI相机”和“小爱同学”作为两条产品发展主线。在这个过程中,小米也一直非常重视人才的引进。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

崔宝秋表示,小米在AI上具有硬件产品的能力、大数据获取能力及生态链的广深布局,这在小米智能手机及众多AIoT设备上都有应用体现。今天小米自研了1000多项技术,同时个人开发者为小米提供了近1700多种技能,这些都是“手机+AIoT”双引擎战略布局必不可缺的。

而提到小爱同学未来方向,崔宝秋说,把“一句话的事”变为“多轮连续对话”,把复杂的事用对话方式解决,是小米努力的方向。谈到小米近期发布的新品,崔宝秋表示其实新发布的手表、手机和电视就是微屏、小屏和大屏三款小爱同学。

二、Kaldi之父Daniel Povey加盟小米后首次亮相

会上,小米还迎来了一位“小爱同学”的强大助攻,国际著名开源语音识别工具Kaldi创始人Daniel Povey已成为了小米语音首席科学家。

Daniel Povey被认为是国际语言语音识别界的天才教授、语音识别开源工具 Kaldi 之父,在加盟小米前,其因奇葩学生事件被普林斯顿大学开除、拒绝Facebook工作机会的过往曾引起了圈内热议。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

Daniel Povey向大家介绍了其下一代Kaldi的计划,其中包括在DNN方面使用PyTorch,增加Python接口,在PyTorch中执行LF-MMI等等。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

小米人工智能部副总经理、小爱团队负责人王刚介绍,在Daniel加盟小米之前,小爱同学使用的语音技术就来源于Daniel开源的软件,Daniel的加盟将增加小米在Kaldi上的优势。

王刚告诉智东西记者,在小爱同学产品研发中遇到新的很多问题是主流研发体系中还没有遇到的,王刚表示,希望能通过与Daniel合作快速用基础技术研发来解决这些问题。接下来Daniel将主要参与“语音识别问题”的研究,涉及中英文混杂识别、方言识别等方面的问题。

三、小爱同学3.0:“多轮对话”,三种性格

会上,小爱同学3.0版也正式发布,据介绍,小爱同学3.0是首个在手机上实现自然连续对话的语音助理,具有全双工自然连续对话能力、AI电话助理、语音遥控器、小爱捷径2.0.、男生版小爱同学等功能和模式。

手机小爱同学负责人介绍,小爱同学3.0版的主要新功能是全双工技术。打电话等实时双向语音交互用的就是全双工技术,但对讲机、现在大多数的智能音箱用的是半双工。除此之外,小爱同学3.0还采用全新的交互框架。

Kaldi之父入职小米后首次亮相,小爱同学3.0未来三大趋势展望

▲小爱同学3.0采用全新的交互框架

#p#副标题#e##p#分页标题#e#

在全双工技术的加持下,用户可以在一次唤醒小爱同学后,持续进行对话,即使被打断,也能够接着边想边说。由此,用户可以用小爱同学进行点外卖、购物、控制电视、接电话等操作。

http://oss.zhidx.com/uploads/2019/11/5dd5567293d69_5dd55672845b4_5dd55672812ce_新录音-30.m4a

▲用小爱同学点外卖

新版小爱同学3.0还新增了男声版,名为“青葱”。阳光的“青葱”与甜美的“蜜糖”,温柔的“茉莉”,形成了三种不同的性格,它们具有不同的声音和不同的话术,从而满足不同的用户需求。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: dawei

【声明】:第七手机网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

为您推荐

无人汽车无法躲避没见过的物体?问题出在训练pipeline上

人类经常会遇到种类新颖的工具、食物或动物,尽管以前从未见过,但人类仍然可以确定这些是新物体。 与人类不同,目前最先进的检测和分割方法很难识别新型的物体,因为它们是以封闭世界的设定来设计的。它们所受的训练是定位已知种类(有标记)的物体,而把未

万字读透自动驾驶3D视觉感知算法

对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周

自动驾驶会使共享经济再次火热吗?

自动驾驶技术的发展一直饱受争议,对于自动驾驶的未来,有一个一直绕不开的话题,那就是自动驾驶是否安全。众所周知,自动驾驶的目标是让自动驾驶汽车可以独立完成出行任务,人类将自己出行需求完全交给自动驾驶汽车,在出行过程中的娱乐需求也可以由自动驾

Cruise自动驾驶决策规划技术解析

Cruise自动驾驶决策规划控制负责人Brandon Basso本科毕业于哥伦比亚大学,博士毕业于加州大学伯克利分校,主要研究决策、机器人系统设计和软件架构、机器学习、控制理论等。曾在3D Robotics、Uber自动驾驶公司工作多年,担任重要职位,在无人机和自动驾驶领

自动驾驶汽车比七个月大的婴儿还聪明吗?

到了七个月大的时候,大多数孩子已经认识到,即使看不见物体,它们仍然存在。把一个玩具放在毯子下面,孩子会知道它的存在,他可以伸手到毯子下面把它拿回来。这种对物体恒存在的理解是正常发展的里程碑,也是现实的基本原则。 这也是自动驾驶汽车所没有的。