您的位置 首页 趣闻

英特尔推出让计算机读懂唇语的AVSR软件

,英特尔推出让计算机读懂唇语的AVSR软件

>  ChinaByte4月29日消息 英特尔推出了一种能让计算机读唇语的软件,朝着更高级的语音识别应用迈出了重要的一步。



  这个名为AVSR(音视频语音识别)的软件能够跟踪讲话人面部表情和嘴唇的移动。通过把这些动作与语言进行比较,这个应用程序可向计算机提供足供的数据对语音识别指令作出回答,即使在噪声很大的环境中也可以。AVSR软件程序是OpenCV计算机图像库的一部分。那

是一个开源软件应用程序和工具集,能够帮助计算机解释图像数据。



  计算机公司多年以来一直设法普及语音识别应用。但是,大多数计算机的处理能力不足和软件性能限制了语音识别技术的开发。现在这两个因素都发生了很快的变化。处理器平均速度速度现在已经达到了1.5GHz以上,最高速度已经达到了3GHz。此外,研究人员编写处理语音指令的应用程序的水平也提高了。



  证明这种应用的一个方法就是把视觉信号转换为英特尔正在做的语音识别方案。例如,微软研究所开发出一种名为“GWindows”的试验型应用程序。用户可以使用语音和手势相结合的方式,利用这个软件对计算机中的文件和窗口进行操作。



  GWindows软件与摄像机一起使用,以便跟踪手等目标的移动。计算机利用统计学原理进行工作。当计算机“看到”用户多次向左挥手,计算机就把这种指令解释为把把文件转移到左面。



  英特尔对于AVSR软件还有其它应用。例如,这种软件可以同摄像机一起用于医院防止病人出现中风的危险,或者用于停车场防止偷窃。其原理是一样的,如果病人的生活节奏变慢或者有人在停车场不进商店而是挨个车观看,这个软件就会根据这些不正常行为发出警报。



  英特尔AVSR软件的这些应用和开发工作是在英特尔公司在北京的中国研究中心进行的。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: dawei

【声明】:第七手机网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

为您推荐

敢为天下后,OPPO Find N折叠屏的底气何在?

聊起OPPO,给我的第一印象就是本分,而在刚刚发布的OPPO Find N折叠屏手机上,我看到的是OPPO敢为天下后的底气。 当大家还沉浸在前一天发布的马里亚纳MariSilicon X影像NPU芯片时,OPPO又在12月15日推出了旗下首款折叠屏手机产品OPPO Find N。这是一款传闻已

OPPO Find N展开一刻,两大创新技术打破折痕路上意难平

荣耀发布了荣耀60系列的新品,特别是荣耀60 Pro的5000万像素超感知AI前置镜头和1亿像素超清后置主摄,是生活和游玩记录的好帮手。多镜录像功能在荣耀50系列上就已开始引入,在荣耀60系列上还新增了AI手势识别,Vlog隔空换镜这一创新功能,对拍摄Vlog来说相当

深扒天玑9000,发冲高关键年产品底气怎样?

联发科的天玑9000自公布以来,以过硬的技术实力迅速冲上了包括微博热搜在内的各类话题平台,吹响了冲击旗舰的号角。手机芯片进入4nm时代,arm推出面向未来十年的v9架构,5G技术R16即将商用,内存技术在升级面对全产业大跃进之势,联发科的天玑也迎来了上升的

想拍更远?汇总今年搭载潜望式长焦摄像头的手机

部分手机摄影发烧友已不再满足普通的2x长焦摄像头,他们需要拍的更远,画质也不能妥协,于是能拍更远的潜望式长焦摄像头就应运而生了。不过当镜头焦距上去了,后置镜头模组的厚度就难以控制,如果强行塞下更长焦段的镜头,模组厚度将达到1~2cm,这样的手机估

像素并非越高越好,为何5000万像素手机镜头倍受青欢迎

500万、800万、1200万像素,智能手机摄像头像素在早年发展的步伐相对还是比较缓慢,近来2000万、4800万、6400万、1.08亿像素接踵而来,手机摄像头的像素规格呈现出十分迅猛的迭代更新速度。然而在2019年首推量产1.08亿像素的智能手机后,至今手机上单颗传感

返回顶部