当前位置:官网首页 > 新闻动态 >
思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

随着人工智能和物联网技术的发展,AI技术纷纷进行着商业化落地并快速升级。AI语音作为人机交互的主要方式之一备受关注,预计2019年中国智能语音市场规模将进一步增长,达到200亿元。

7月19日,由深圳湾主办的 WARE 2019第Ⅱ季 新硬件AI技术与应用峰会在深圳举行,该峰会汇聚了AI语音行业的各位大咖,共话AI语音的前沿技术、落地应用及未来演变趋势。

现场,思必驰CMO龙梦竹以”无微不至,智能小家电的AI攻势“为题进行了分享。 

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

图:思必驰CMO龙梦竹

她表示,消费市场靠智能音箱打响了第一枪,目前全行业全品类也在逐渐+AI,硬件、服务、交互体验均在升级,去中心化趋势明显。

思必驰作为全链路语音技术方案的提供商,面对日渐发展的蓝海市场,感受到了技术需求的明显变化。例如,算法和算力作为原动力,推动着AI滚滚前行,5G时代的到来给予了人工智能更强大的计算空间,但是对于台灯、插座、耳机等以极简化的命令式交互为主的终端来讲,更轻快的能效体验成为需求。

一直以来,超高度的定制化是IOT类产品企业的强需求,就此思必驰做深做透,结合个性化定制的需求,推出DUI开放平台,用户在语音技术、应用场景、对话逻辑、技能知识等方面均可自行定制,增强产品的个性化特征。

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

在这一过程中,对于智能小家电、智能穿戴类企业而言,除定制需求外,在特定场景下的功能、功耗、能效、响应速度等方面均有不同需求。龙梦竹表示,通过实际对接过程中反哺技术的更新,我们发现了一些“深藏不露”的技术热点。

全双工,进一步推进人机对话的演变。

从单轮对话到多轮对话,全双工技术进一步推进人机对话的演变,使其具备实时智能响应、智能打断、智能纠错、多轮交互等能力,源源不断的语音上行流和源源不断的下行流,支持机器听+说同时进行,具备智能决策的能力,能够判断噪音、指令、响应时间、响应信号等,并可通过语义分析判断语气词、无效词、可忽略的停顿等,具备一次ag真人娱乐官网唤醒、多次交互的能力。

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

龙梦竹表示,全双工语音技术的成熟应用让机器智能对话变得更流畅。但是,全双工尚未成熟到通用阶段,但在部分应用场景中已初见成效,例如在智能客服场景,以及命令式交互为主的智能设备,比如台灯、耳机、空调等,比如“你好小驰,空调开到,嗯,20度,不不不,25度吧。”。

分布式麦克风阵列方案的需求浮出水面。

当前,麦克风阵列技术在智能音箱市场中的应用已十分普遍,远场交互、声源定位、算法降噪等技术均优化了产品体验,例如,思必驰双麦、线性/环形4麦、线性/环形6麦等多款软硬一体化方案的市场应用已十分成熟。

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

但是,随着多品类智能终端产品在用户生活中涌现,“一呼百应”的情况常常发生,此时,对分布式麦克风阵列解决方案的需求便浮出水面。

分布式麦克风阵列可让多个非结构排列的无规则麦克风组成阵列系统,提供就近唤醒功能,相对于规则化的麦阵,功耗更低。同时,借助声纹识别技术,判断说话人身份,避免设备长时间处于工作状态,达到低功耗目的。

全屋智能,多设备联动唤醒机制十分必要。

例如,正面唤醒可以通过近距离交互方式,面对面地唤醒设备以避免多设备误唤醒;就近唤醒则利用声波到达设备的时间差,对同一唤醒词的多款设备进行空间计算,利用二级唤醒机制来唤醒距离用户最近的设备;语义选择会基于one-shot云+端混合识别技术,实现本地唤醒词和云端识别语义一体化,基于用户语义分析用户意图,以唤醒相应设备;多模态交互技术带来了多模态直视唤醒,模拟人与人眼神交互的特点,唤醒用户需要交互的设备。

这些深藏不露的技术热点,让语音交互在IOT中的应用更加流畅自然。

同时,面对智能小家电、智能穿戴产品对低功耗的需求,思必驰推出低功耗算法方案,能够让设备持续工作、随叫随到,让更多的小设备快速+AI。

思必驰低功耗算法方案将根据硬件结构评审和声学评估结果,结合产品应用场景,提供相应的单项/组合项算法方案,主要可分为一级低功耗唤醒,二级唤醒验证,三级声纹验证。

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

尤其是一级低功耗唤醒,根据设备的基础情况,我们还会提供更适合的算法方案,例如,针对台灯、插座、低端的儿童玩具等小型、单一功能设备,且仅存在完全的近场唤醒需求类的产品,小模型语音唤醒方案即可满足需求。但,对于耳机、手机、白电类等具备相对远场需求的产品,双麦远场唤醒方案则更为合适。

该低功耗算法方案同样具备超高的定制能力,例如唤醒词定制,根据产品的目标人群年龄特征、地域特征的口音定制,根据产品应用的车载、商场、骑行等场景的噪声环境定制,根据芯片选型、硬件设计等进行灵活组合与定制。

“算法+芯片”的深度融合,带来了整体性能的升级。

思必驰携手子公司深聪智能打造了低功耗AI语音芯片TH1520,通过软硬件协同设计、优化整合型专用芯片,算法+芯片深度融合的嵌入式系统,取代通用芯片+通用算法的解决方案,打造可编程、定制化专用型 AI 深度学习架构,取代目前第三方通用型架构。目前,该芯片正式进入产品对接测试阶段。

TH1520在处理远场以及复杂声场下的各项体验指标处于业界领先,支持离线识别,可全离线应用,而且功耗极低,待机状态功耗毫瓦级,全速工作功耗不大于百毫瓦,可用电池供电,使得便携和移动场景成为可能,片内存储亦可大幅节省成本和总体功耗。同时,算法+芯片的方案可进行快速移植与部署,将产品推向市场。

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

目前该方案可应用于智能耳机、智能手机、智能门、智能台灯等多款产品。思必驰也将不断优化技术方案,为更多IOT产品带来优质体验。

越是体积小巧的设备,对功耗性能、集成工艺的要求越高。思必驰解决方案软硬兼施,应对智能小家电的AI攻势。