家电遥控器中的那些语音识别long88.vip龙8国际盘点

电子龙8国际娱乐网站 2018-01-13 08:08 次阅读
介绍一种适合家电遥控器应用的语音识别算法,该算法使用双模块和两级端点检测方法,能有效地提高识别和稳健性;介绍利用该long88.vip龙8国际实现的一种新型学习型遥控器,展现了语音识别long88.vip龙8国际在家电领域的广阔前景。 关键词:语音识别 DTW FED FRED 学习型遥控器 家用电器发展的一个重要方面是让用户界面更加人性化,更加方便自然,做到老年人和残疾人可以无障碍地使用。利用语音识别long88.vip龙8国际实现语音控制是提高家电产品用户界面质量的一条重要途径。 本文以语音控制遥控器为例,说明语音识别long88.vip龙8国际如何应用在家电器领域。 适合家用电器应用的语音识别嵌入式系统结构如图1所示,它由四个部分组成。第一部分为模/数转换部分,其输入端接收输入的语音信号,并将其转化成数字芯片可处理的数字采集信号;在输出端将解码后的语音数字信号转换为音频模拟信号,通过扬声器放声。第二部分为语音识别部分,它的作用是对输入的数字语音词条信号进行分析,识别出词条信号所代表的命令,一般由DSP完成。第三部分语音提示和语音回放部分,它一般也是在DSP中完成的,其核心是对语音信号进行数字压缩编码和解码,目的是提示用户操作并对识别语音的响应,完成人机的语音交互。第四部分是系统控制部分,它将语音识别结果转换成相应的控制信号,并将其输出转换成物理层操作,完成具体功能。语音识别与系统控制的有机结合是完成声控交互的关键,下面将对语音识别算法及遥控系统控制部分作详细的讨论。 1 语音识别算法 目前,常以单片机MCU)或DSP作炎硬件平台的实现消费类电子产品中的语音识别。这类语音识别主要为孤立词识别,它有两种实现方案:一种是基于隐含马尔科夫统计模型(HMM)框架的非特定人识别;另一种是基于动态规划(DP)原理的特定人识别。它们在应用上各有优缺点。HMM非特定人员的优点是用户无需经过训练,可以直接使用;并且具良好的稳定性(即对使用者而言,语音识别性能不会随着时间的延长而降低)。但非特定人语音识别也有其很难克服的缺陷。首先,使用该方法需要预先采集大量的语料库,以便训练出相应的识别模型,这就大大提高了应用此long88.vip龙8国际的前期成本;其次,非特定人语音识别很难解决汉语中不同方言的问题,限制了它的使用区域;另外还有一个因素也应予以考虑,家电中用于控制的具体命令词语最好不要完全固定,应当根据的用户的习惯而改变,这一点在非特定人识别中几乎不可能实现。因此大多数家电遥控器不适合采用此方案。 DP特定人识别的优点是方法简单,对硬件资源要求较低;此外,这一方法中的训练过程也很简单,不需预先采集过多的样本,不仅降低了前期成本,而且可以根据用户习惯,由用户任意定义控制项目的具体命令语句,因而适合大多数家电遥控器的应用。DP特定识别的严重缺点是它的稳健性不理想,对有些人的语音识别率高,有的人识别率却不高;刚训练完时识别率较高,但随着时间的推迟而识别率降低。些缺点往往给用户带来不便。为克服这些缺陷,对传统方法作为改进,使识别性能和稳健性都有显著的提高,取得令人满意的结果。 1.1 端点检测方法 影响孤立词识别性能的一个重要因素是端点检测准确性。在10个英语数字的识别测试中,60毫秒的端点误差就使识别率下降3%。 对于面向消费类应用的语音识别芯片系统,各种干扰因素更加复杂,使精确检测端点问题更加困难。为此,提出了称为FRED(Frame-based Readl_time Endpoint Detection)算法[3]的两级端点检测方案,提高端点检测的精度。第一级对输入语音信号,根据其能量和过零率的变化,进行一次简单的实时端点检测,以便去掉静音得到输入语音的时域范围,并且在此基础上进行频谱特征提取工作。第二级根据输入语音频谱的FFT分析结果,分别计算出高频、中频和低频段的能量分布特性,用来判别轻辅音、浊辅音和元音;在确定了元音、浊音段后,再向前后两端扩展搜索包含语音端点的帧。FRED端点检测算法根据语音的本质特征进行端点检测,可以更好地适应环境的干扰和变化,提高端点检测的精度。 在特定人识别中,比较了常用的FED(Fast Endpoint Detection)[5]和FRED两种端点检测算法的性能。两种算法测试使用相同的数据库,包括7个人的录音,每个人说100个人名,每个人名读3遍。测试中的DP模板训练和识别算法为传统的固定端点动态时间伸缩(DTW)模板匹配算法[4]。两种端点检测算法的识别率测试结果列在表1中。 表1 比较FED和FRED端点检测算法对DTW模板匹配识别率的影响 端点检测算法第1人第2人第3人第4人第5人第6人第7人平均 FED 92.5% 87% 92.6% 95.6% 96.2% 96.8% 100% 94.4% FRED 94.3% 89.9% 93.2% 99.4% 99.4% 98.8% 100% 96.4% 测试结果说明:使用FRED端点检测算法,所有说话人的识别率都有了不同程度的提高。因此,本系统采用这种两级端点检测方案。 1.2 模拟匹配算法 DTW是典型的DP特定人算法,为了克服自然语速的差异,用动态时间规整方法将模板特征序列和语音特征序列进行匹配,比较两者之间的失真,得出识别判决的依据。 假设存储的一个词条模板包括M帧倒谱特征R={r(m);m=1,2,∧,M};识别特征序列包括N帧倒谱特征T={t(n);n=1,2, ∧,N}。在r(i)和t(i)之间定义帧局部失真D(i,j),D(i,j)=|r(i)-t(i)| 2,通过动态规划过程,在搜索路径中找到累积失真最小的路径,即最优的匹配结果。采用对称形式DTW: 其中S(i,j)是累积失真,D(i,j)是局部失真。 当动态规划过程计算到固定结点(N,M)时,可以计算出该模板动态匹配的归一化距离,识别结果即该归一化距离最小的模板词条:x=argmin{S(N,Mx)}。 为了提高DTW识别算法的识别性能和模板的稳健性,提出了双模板策略,即x=argmin{S(N,M2x)}。第一次输入的训练词条存储为第一个模板,第二次输入的相同训练词条存储为第二个模板,希望每个词条通过两个较稳健的模板来保持较高的识别性能。与上面测试相同,也利用7个人说的100个人名,每个人名含3遍的数据库,比较DTW单模板和双模板的性能差别,结果更在表2中。 表2 DTW不同模板数的识别率比较 DTW 第1人第2人第3人第4人第5人第6人第7人平均 单模板 94.3% 89.9% 93.2% 99.4% 99.4% 98.8% 100% 96.4% 双模板 99.4% 96.6% 98.5% 100% 100% 98.8% 100% 99.0% 测试结果说明:通过存储两个模板,相当大地提高了DTW识别的性能,其稳健性也有很大的提高。因此,对特定人识别系统,采用DTW双模板是简单有效的策略。 综上所述,该嵌入式语音识别芯片系统采用了改进端点检测性能的FRED算法,12阶Mel频标倒谱参数(MFCC)作为特征参数,使用双模板训练识别策略。通过一系列测试,证明该系统对特定人的识别达到了很好的识别性能,完全可以满足家用电器中声控应用的要求。 2 语音控制遥控器龙8国际娱乐网站 目前家用遥控器主要为按键式,并有两种类型:一种是固定码型,每个键对应一种或几种码型,都是生产厂家预先设定好的,用户不能更改;另一种是学习型,具有自我学习遥控码的功能,可由用户定义遥控器的每个键对应的码型,它能够将多种遥控器集于一身,用一个遥控器就可控制多个 家电,又可以作为原配遥控器的备份。由于现代家电功能不断增加,上述两种遥控器都有按键过多,用户不易记住每个键的含义等问题。将语音识别long88.vip龙8国际应用于学习型遥控器,利用语音命令代替按者对命令的记忆和使用,同时省去了大量按键,缩小了遥控器的体积。 语音控制遥控器的硬件框图如图2所示,它由两个独立的模块组成:语音信号处理模块和系统控制模块。 语音信号算是模块由DSP、快闪存储器(FLASH)、编解码器(CODEC)组成。其中DSP是整个语音识别模块的核心,负责语音识别、语音编解码,以及FLASH的读写控制。DSP的优点是运算速度快、内存空间大、数据交换速度快,可用来实现复杂的算法,提高识别率,减小反应延时,得到较高的识别性能。DSP芯片选用Analog Devices公司的AD2186L,它具有如下特点:①运算速度达40MIPS,且均为高效的单调周期指令;②提供了40K字节的片内RAM,其中8K字(16Bit/字)为数据RAM,8K字(24Bit/字)为程序RAM,最大可达4兆字节的存储区,用于存储数据或程序;③3.3V工作电压,具有多种省电模式。AD2186L既能完成与语音信号算是相关的算法,又适合使用电池作能源的遥控器。FLASH和CODEC也都选用3.3V工作电压的芯片。 FLASH为美国ATMEL公司的AT29LV040A(4M Bit),它作为系统的存储器,主要用于存放以下内容:提示语音合成所需的参数,特定人训练后的码本数据,DSP系统的应用程序和学习和遥控码数据。CODEC选用美国TI公司的TLV320AC37,用来进行A/D、D/A变换、编码和解码。 系统控制模块由单片机、红外接收发送器、电源管理电路组成。单片机负责整个遥控器的系统控制。单片机作为主控芯片,进行键盘扫描,根据用户通过键盘输入的指令,分别完成学习遥控码;控制DSP进行语音训练、回放、识别;将识别结果转换成相应的遥控码,通过红外发光管发射出去。单片机与DSP之间通过标准的RS232串行协议通讯。 系统的控制软件流程图如图3所示。在使用前,按“学习键”进入学习状态,用户先对学习型遥控器训练语音命令,并使其学习与各语音命令相对应的原理控码型。使用时按“识别键”,进入语音识别状态,等待语音处理模块返回结果,若返回正确的识别结果,则把相应的遥控码发射出去。例如,原电视遥控器数字键“1”对应中央1台,用户的训练命令为“中央1台”,学习了原遥控器的数字键“1”的遥控码,并使其与训练命令“中央1台”对应起来。于是使用时只需对着学习型遥控器的麦克风说出“中央1台”,电视就会切换到中央1台。 这样用户不需要记住每个电视台与台号的对应关系,相对于枯燥的频道数字,用户自定义的命令更容易记住。 若连续的30秒无正确的命令则遥控器进入休眠状态,单片机控制电源管理电路切换DSP和FLASH电源,单片机本身也进入休眠状态,直至用户按键,唤醒单片机,再由单片机控制恢复DSP和FLASH供电,重新开始工作。这是因为整个系统中,DSP的功耗最大,长时间不用时,关闭语音信号处理模块,可以显著地降低整个系统的功耗。 从实验室走向市场的过程中,可靠性与成本是遇到的最大挑战。采用双模板的DTW和两组端点检测FRED算法,可在系统资源和反应延时增加极小的情况下,有效地提高识别率和稳健性。该项long88.vip龙8国际成功地运用在学习型遥控器上,展现了语音识别long88.vip龙8国际在家电领域的广阔前景。
收藏 人收藏
分享:

评论

相关推荐

天猫精灵X1智能音箱评测 语音识别越来越智能

从BB机到大哥大再到如今的手机,尽管它的形状在不断演变,但从整体趋势来看,同质化的外观和高配低价的促....
的头像 39度创意研究所 发表于 11-19 09:34 318次 阅读
天猫精灵X1智能音箱评测 语音识别越来越智能

求简单经济的语音识别方案

我想做个智能LED灯,只要识别简单的“开”“关”语音即可,求各位大佬推荐个方案 ...
发表于 11-19 09:04 34次 阅读
求简单经济的语音识别方案

语音识别是什么

语音识别是一门交叉学科。近二十年来,语音识别long88.vip龙8国际取得显著进步,开始从实验室走向市场。人们预计,未来1....
的头像 发烧友学院 发表于 11-18 09:28 238次 阅读
语音识别是什么

扬声器保护电路分享

发表于 11-16 16:26 119次 阅读
扬声器保护电路分享

频谱分析仪N9340B上的扬声器如何激活

你好先生和夫人我想问一下如何激活频谱分析仪N9340B上的扬声器图标。 每次我使用频谱分析仪N9340B进行场强测量时,即使我尝...
发表于 11-15 16:36 20次 阅读
频谱分析仪N9340B上的扬声器如何激活

三星推出全新语音控制媒体API,中国5G研发进入全球领先梯队

在一年一度的 SDC 2018 开发者大会上,三星新推出的语音媒体控制 API,将允许应用和服务更轻....
的头像 高工智能未来 发表于 11-15 15:56 366次 阅读
三星推出全新语音控制媒体API,中国5G研发进入全球领先梯队

捷通华声灵云AI研发团队推出四川话语音识别long88.vip龙8国际

在语音识别核心算法上,捷通华声对建模单元粗粒度、模型训练方法、解码帧率进行创新优化,有效提升了语音识....
的头像 CTI论坛 发表于 11-09 16:24 1683次 阅读
捷通华声灵云AI研发团队推出四川话语音识别long88.vip龙8国际

人工智能识别率提升解决方案

科技高速发展的今天,人工智能已经逐步成为了客户选择产品的一项硬性指标,语音识别、声纹认证、人脸识别等....
的头像 CTI论坛 发表于 11-08 15:56 467次 阅读
人工智能识别率提升解决方案

盘点教育long88的市场现状及如何突破百亿美元市场

产品的不成熟正逐渐消耗消费者对行业的新鲜感。在市场利弊两方面的影响下,教育long88正呈现出日益清晰的市....
的头像 long88前沿 发表于 11-06 09:42 596次 阅读
盘点教育long88的市场现状及如何突破百亿美元市场

科大讯飞语音翻译新long88.vip龙8国际路线上再获突破

除了科大讯飞,IWSLT 2018吸引了世界各地多所机器翻译领域的知名大学及研究所参加,包括英国爱丁....
的头像 新智元 发表于 11-05 17:14 917次 阅读
科大讯飞语音翻译新long88.vip龙8国际路线上再获突破

不再只为听到更大的声音,意大利AD-F10测评

Ernst W. Siemens (Siemens & Halske公司创始人)于1874年1月20日,申请了电动式扬声器原型专利,让带支撑系统的音圈处于磁场...
发表于 11-05 17:05 1082次 阅读
不再只为听到更大的声音,意大利AD-F10测评

CYW9439x平台是否支持语音识别?

CYW9439平台支持语音识别吗?如果没有,有没有计划将语音识别软件添加到SDK? 以上来自于百度翻译    ...
发表于 11-05 14:21 53次 阅读
CYW9439x平台是否支持语音识别?

美萍网络long88.vip龙8国际有限公司研发出AI智能电销long88,适用于销售行业

美萍AI智能电销long88(俗称:电销long88、电话long88、电话营销long88、智能语音long88),是美萍网络技....
发表于 11-03 08:33 212次 阅读
美萍网络long88.vip龙8国际有限公司研发出AI智能电销long88,适用于销售行业

联想发布S5 Pro 搭载双扬声器和四摄

常程回归联想手机业务之后,联想对手机产品线进行了重新梳理。除了 MOTO 之外,联想品牌之后主要以 ....
的头像 摄像头观察 发表于 11-02 15:39 946次 阅读
联想发布S5 Pro 搭载双扬声器和四摄

ReSpeaker语音识别

Seeed的ReSpeaker是一个语音识别界面,可以让你破解周围的东西,从家用电器到办公室的东西,以及配备互联网的设备。 ReSp...
发表于 11-01 15:46 118次 阅读
ReSpeaker语音识别

Cirrus Logic的语音捕获开发套件和Seeed的ReSpeaker核心

今天,我很高兴推出两款可以帮助您为产品添加语音识别服务的设备。 语音识别在我们日常生活中使用的产品和设备中变得不那么新颖...
发表于 11-01 15:45 38次 阅读
Cirrus Logic的语音捕获开发套件和Seeed的ReSpeaker核心

云从科技在语音识别long88.vip龙8国际上取得重大突破

10 月 29 日,云从科技宣布在语音识别long88.vip龙8国际上取得重大突破,该long88.vip龙8国际在全球最大的开源语音识别数据集 ....
的头像 long88long88.vip龙8国际与应用 发表于 11-01 15:13 735次 阅读
云从科技在语音识别long88.vip龙8国际上取得重大突破

云从科技打破世界纪录 语音识别准确率达97.03%

2018年10月 29日,中国人工智能“国家队”云从科技在语音识别long88.vip龙8国际上取得重大突破,他们融合图像识....
的头像 芯智讯 发表于 10-31 17:11 713次 阅读
云从科技打破世界纪录 语音识别准确率达97.03%

未来的长虹,究竟将变成什么样子?

长虹由研发服务、供应链服务、制造服务、财务服务、投融资服务五个方面组成的产业服务平台,可以为企业级用....
的头像 刘步尘 发表于 10-31 16:34 1496次 阅读
未来的长虹,究竟将变成什么样子?

请问耳机扬声器一层膜展现多层次的音乐的原理是什么?

扬声器单元大体是由永磁体、音圈和振膜组成的。 简单来说音圈原理就是根据声音调整线圈电流大小,产生不同的电磁场,并驱动...
发表于 10-31 09:50 64次 阅读
请问耳机扬声器一层膜展现多层次的音乐的原理是什么?

人工智能行业的七大发展趋势

近些年随着人工智能long88.vip龙8国际研究不断突破,资本呈现热捧趋势,机器学习、自然语言处理、语音识别等代表性人工智....
的头像 long88博览 发表于 10-30 16:26 706次 阅读
人工智能行业的七大发展趋势

华为AI十强应用

现在大火的AI,从概念落地到成为人们普遍接受的现实,度过了将近70年的时间。而当下,AI正在以最切实....
的头像 电子发烧友网工程师 发表于 10-27 10:23 874次 阅读
华为AI十强应用

手把手教你如何构建一个能够识别歌曲类型的神经网络

你可以在前面的输出中看到节拍,但由于它们只有30秒长,因此很难看到单个的节拍。将它与古典乐相比较,会....
的头像 新智元 发表于 10-27 10:11 517次 阅读
手把手教你如何构建一个能够识别歌曲类型的神经网络

一种使用NE555制作光照变音电路的方法

电路组成如图所示:该电路由BT(4.5V),开关(S),U(555)双极型时基集成电路。电容C1(1....
的头像 39度创意研究所 发表于 10-27 09:33 229次 阅读
一种使用NE555制作光照变音电路的方法

BC009本地智能语音识别模块

BC009 本地智能语音识别模块 1、产品特征 ² 1 米内识别率 90%以上 ² 可以通过语音指令控制输出 ² 可以通过单片机串口...
发表于 10-26 14:49 198次 阅读
BC009本地智能语音识别模块

M4 amp是否应该变得更大

M4上限? 最初他们有两个15000uf 75v我订购18000uf 80v chemi-con帽子,并且想知道我是否应该变得更大或更好? 人们谈论的旁路...
发表于 10-25 14:17 68次 阅读
M4 amp是否应该变得更大

微软正在研发一种识别静音语音命令的long88.vip龙8国际

微软一直致力于开发一种新的语音输入接口,允许用户在没有语音泄漏的情况下进行说话和录音。
的头像 1号long88网 发表于 10-22 09:11 371次 阅读
微软正在研发一种识别静音语音命令的long88.vip龙8国际

一个高精确度的独立电唱机前置放大器的中文资料概述

最近有非常多关于历史悠久的真空电子管的优点(和缺点)的新闻。至于这种复古运动多少是基于可论证的理论,....
发表于 10-22 08:00 154次 阅读
一个高精确度的独立电唱机前置放大器的中文资料概述

科大讯飞占地风波使得科大讯飞股价持续下挫

科大讯飞非法侵占安徽扬子鳄国家级自然保护区,以建设培训基地为名开发房地产。 内部人士透露,科大讯飞....
的头像 电子发烧友网工程师 发表于 10-21 09:38 2901次 阅读
科大讯飞占地风波使得科大讯飞股价持续下挫

零基础入行深度学习

深度学习到底有多热,这里我就不再强调了,也因此有很多人关心这样的几个问题,“适不适合转行深度学习(机....
的头像 Imagination Tech 发表于 10-19 14:07 384次 阅读
零基础入行深度学习

思必驰携语音识别long88.vip龙8国际亮相2018AIIA人工智能开发者大会

在思必驰公开课——《对话系统中的自然语言处理long88.vip龙8国际》上,思必驰算法工程师朱苏、陈露和思必驰NLP负责人....
的头像 TechSugar 发表于 10-19 08:55 1300次 阅读
思必驰携语音识别long88.vip龙8国际亮相2018AIIA人工智能开发者大会

谷歌和Idiap研究所的研究人员训练了两个独立的神经网络

研究人员的语音过滤系统分为两部分,包括LSTM模型和卷积神经网络(只有一个LSTM层)。第一个采用预....
的头像 新智元 发表于 10-18 10:39 1105次 阅读
谷歌和Idiap研究所的研究人员训练了两个独立的神经网络

立讯/美律是2018~2019年iPhone声学零组件最大赢家

随后,两者的交易继续曲线上演,美律又与立讯精密签订协议,将主营业务为微型扬声器模组的苏州工厂美特51....
的头像 MEMS 发表于 10-17 14:44 1584次 阅读
立讯/美律是2018~2019年iPhone声学零组件最大赢家

ASR语音识别long88.vip龙8国际的介绍应用和优势及实际案例分析

ASR(Automatic Speech Recognition) 自动语音识别long88.vip龙8国际是基于关键词语列....
发表于 10-17 08:00 56次 阅读
ASR语音识别long88.vip龙8国际的介绍应用和优势及实际案例分析

雅马哈RX-V481功放扬声器快速操作指南和使用说明书资料免费下载

本文档的主要内容详细介绍的是雅马哈RX-V481功放快速操作指南和使用说明书资料免费下载。
发表于 10-15 08:00 106次 阅读
雅马哈RX-V481功放扬声器快速操作指南和使用说明书资料免费下载

一种基于PCB的抑制电磁干扰龙8国际娱乐网站方案

印制板的龙8国际娱乐网站是制作电子产品的重要一环,随着电子long88.vip龙8国际的飞速发展,PCB的密度越来越高,PCB龙8国际娱乐网站的好坏....
的头像 电子龙8国际娱乐网站 发表于 10-14 11:39 192次 阅读
一种基于PCB的抑制电磁干扰龙8国际娱乐网站方案

TTS和ASR的概念区别!TTS的评判标准

在用户预期不苛刻的场景(APP/硬件),能满足商业化需求,比如语音助手/滴滴/高德/智能音箱/long88....
的头像 将门创投 发表于 10-13 09:52 872次 阅读
TTS和ASR的概念区别!TTS的评判标准

long88将成为最先进的生产力,而语音语义将是人工智能的根

硬件支持随着long88.vip龙8国际和内容的问题得到解决,long88将会变得更加实用和更加强大。人工智能最终体现两方面,一个....
的头像 谛听long88 发表于 10-12 17:01 748次 阅读
long88将成为最先进的生产力,而语音语义将是人工智能的根

2018谷歌硬件新品发布会看点,谷歌带来了Pixel3系列手机新品

2018谷歌硬件新品发布会部分看点此外, 谷歌在发布会非常关注Pixel 3相机,谷歌自信地称之为“....
的头像 TechSugar 发表于 10-12 15:17 2266次 阅读
2018谷歌硬件新品发布会看点,谷歌带来了Pixel3系列手机新品

中国科技发展40年巨变,变的是什么?不变的又是什么?

改革开放40年来,我国科技事业实现了跨越式发展,成为具有全球影响力的科技大国,多项指标位居世界前列。
的头像 深圳创新龙8国际娱乐网站研究院 发表于 10-12 15:15 831次 阅读
中国科技发展40年巨变,变的是什么?不变的又是什么?

今年iPhone XS Max最让你满意的升级是哪点呢?

整个测试的过程非常简单,当然也更加倾向于大家日常的使用需求,iPhone XS Max与Note 9....
的头像 iPhone频道 发表于 10-10 17:33 1392次 阅读
今年iPhone XS Max最让你满意的升级是哪点呢?

发展中国家隐藏着语音识别的金矿?

谷歌的人工智能语音助手嵌入了全球数十亿部智能手机中,相应的语音识别long88.vip龙8国际在识字率低的发展中国家显得尤为....
的头像 重庆物联网 发表于 10-10 16:25 512次 阅读
发展中国家隐藏着语音识别的金矿?

V-MODA推出的蓝牙连接的扬声器和耳机放大器具有定制的3D打印外壳

近日,意大利音频设备制造商V-MDA对外发布了其最新的产品“Remix”,一个蓝牙连接的扬声器和耳机....
发表于 10-09 17:12 148次 阅读
V-MODA推出的蓝牙连接的扬声器和耳机放大器具有定制的3D打印外壳

盘点语音识别long88.vip龙8国际在人工智能中的应用

语音是人类最自然的交互方式。计算机发明之后,让机器能够“听懂”人类的语言,理解语言中的内在含义,并能....
的头像 传感器long88.vip龙8国际 发表于 10-08 15:54 863次 阅读
盘点语音识别long88.vip龙8国际在人工智能中的应用

基于对图片的语音描述,可以学习在图片中辨认目标物体

这项工作是Harwath等人早期一项研究的扩展,他们当时研究将语音与相关主题的图片相连接。在早期研究....
的头像 论智 发表于 10-04 10:30 435次 阅读
基于对图片的语音描述,可以学习在图片中辨认目标物体

语音识别的最大市场在哪里?

谷歌的人工智能语音助手嵌入了全球数十亿部智能手机中,相应的语音识别long88.vip龙8国际在识字率低的发展中国家显得尤为....
的头像 物联网long88.vip龙8国际 发表于 09-29 09:07 659次 阅读
语音识别的最大市场在哪里?

浅析语音识别long88.vip龙8国际的工作原理及发展

语音是人类最自然的交互方式。计算机发明之后,让机器能够“听懂”人类的语言,理解语言中的内在含义,并能....
的头像 传感器long88.vip龙8国际 发表于 09-28 15:44 893次 阅读
浅析语音识别long88.vip龙8国际的工作原理及发展

声音隔离long88.vip龙8国际增强与识别语言准确度

声音或语音用户接口在手机、平板电脑、可穿戴设备和其它智能设备上变得越来越普遍和重要,因为这项long88.vip龙8国际确实....
的头像 电子龙8国际娱乐网站 发表于 09-27 07:35 572次 阅读
声音隔离long88.vip龙8国际增强与识别语言准确度

在认知智能领域,AI企业如何才能取得进一步的突破?

在计算智能方面,机器早已远远超过人类。而在感知智能方面,机器也已达到可媲美人类的水平。科大讯飞在语音....
的头像 新智元 发表于 09-26 09:16 1080次 阅读
在认知智能领域,AI企业如何才能取得进一步的突破?

科大讯飞回应AI同传造假:AI无法替代同传

科大讯飞以智能语音long88.vip龙8国际起家,其讯飞听见智能会议系统应用较广,包括2017全国两会、2018年博鳌亚洲....
的头像 1号long88网 发表于 09-25 16:56 3079次 阅读
科大讯飞回应AI同传造假:AI无法替代同传

聆听Alexa核心团队科学家解读语音语义的奥秘

远场语音识别是指在较远的距离条件下(通常是1m-10m),机器对语音加以识别的long88.vip龙8国际。该long88.vip龙8国际一般采用麦....
的头像 电子发烧友网工程师 发表于 09-25 11:08 791次 阅读
聆听Alexa核心团队科学家解读语音语义的奥秘

谷歌称语音识别是下一个机会,尤其在发展中国家

虽然人工智能long88和自动驾驶汽车可能成为未来的头条新闻,但谷歌搜索负责人本·戈麦斯(Ben Gome....
的头像 罗欣 发表于 09-25 10:00 670次 阅读
谷歌称语音识别是下一个机会,尤其在发展中国家

科大讯飞“AI 同传”造假?误会了!

看其定位主要聚焦学术会议直播,科大讯飞是语音long88.vip龙8国际的提供方,因此尽管宣传中有提到“智能翻译和自动语音播....
的头像 新智元 发表于 09-25 09:37 1816次 阅读
科大讯飞“AI 同传”造假?误会了!

语音识别long88.vip龙8国际是什么?该怎么理解它?

在语音控制long88.vip龙8国际蓬勃发展的今天,语音助手的实用性和趣味性在同步提高。
发表于 09-21 10:10 760次 阅读
语音识别long88.vip龙8国际是什么?该怎么理解它?

“人工智能的过去、现在和未来”的尖峰对话

另外,微软的人工智能long88.vip龙8国际在安全、数据隐私方面做的非常好。由于我们在收集越来越多的数据,我们要非常谨慎....
的头像 工业4俱乐部 发表于 09-20 16:50 1112次 阅读
“人工智能的过去、现在和未来”的尖峰对话

智能音箱市场表面上形势一片大好,突破壁垒的关键是语音识别

在目前全球范围内掀起的人工智能浪潮中,智能音箱作为全新的人机交互体验最佳的入口,成为了世界科技巨头们....
发表于 09-20 16:49 495次 阅读
智能音箱市场表面上形势一片大好,突破壁垒的关键是语音识别

2018年十大新兴long88.vip龙8国际大盘点:ARlong88.vip龙8国际无处不在

在复杂性更高的层次,long88.vip龙8国际正在开发中,以便让下一代数字助手来吸收和组织更多的非结构化数据(原始文本、视....
的头像 电子发烧友网工程师 发表于 09-20 10:34 1648次 阅读
2018年十大新兴long88.vip龙8国际大盘点:ARlong88.vip龙8国际无处不在

浅析语音识别long88.vip龙8国际的难点及对策

在人际交往中,言语是最自然并且最直接的方式之一。随着long88.vip龙8国际的进步,越来越多的人们也期望计算机能够具备与....
的头像 物联网资本论 发表于 09-19 16:47 787次 阅读
浅析语音识别long88.vip龙8国际的难点及对策

飞速发展的人工智能long88.vip龙8国际,在你的生活中出现了几个?

提到语音识别,人们第一时间会想到手机里的Siri。你可以直接通过语音告诉它你的想法、需求或者任何其他....
的头像 将门创投 发表于 09-19 09:31 738次 阅读
飞速发展的人工智能long88.vip龙8国际,在你的生活中出现了几个?

探讨语音识别long88.vip龙8国际的发展历史、难点及对策

在人际交往中,言语是最自然并且最直接的方式之一。随着long88.vip龙8国际的进步,越来越多的人们也期望计算机能够具备与....
的头像 传感器long88.vip龙8国际 发表于 09-17 10:22 727次 阅读
探讨语音识别long88.vip龙8国际的发展历史、难点及对策