java自然语言理解分频_如何评价华为 2019 年 11 月 25 日发布的 Sound X 智能音箱?...

news/2024/7/8 13:17:18

HiFi+智能,华为Sound X 回归音箱本质,提供真正的环绕立体声效果。同时,并没有牺牲智能交互体验。接下来,带大家去了解这款新品的更多信息!

声智科技基于SoundAI Cimon声学软件和SoundAI Babel开放大脑,为华为Sound X提供了包括定向拾音、回声消除、声源定位、噪声抑制、混响消除、波束形成、语音唤醒等在内的核心技术,有效保障了智能音箱真实环境中5m范围内的流畅交互体验,满足用户在真实环境中无死角的远场交互需求。

澎湃低音,灵敏唤醒

华为Sound X 最为人津津乐道的特色之一便是令人震撼的澎湃低音,不仅音量4倍于同档位音箱,而且通过内部6个全频喇叭加外部双低音单元的独立设计,打造出现场级别的澎湃低音效果。同时,采用开放式低音单元设计,当音乐播放时,声波会带动喇叭产生有节奏感的震动效果,为用户提供听觉、视觉的双重体验。但震撼的低音效果同时也提升了智能交互的难度,大音量、双低音带来强烈的自噪声干扰,极大地提高了声学处理的计算量。

对此,声智科技通过独家优化的回声消除算法加以解决。在目前市场上已有的产品中,回声消除已经可以有效应对中高频段的自噪声问题,但对于低频的处理效果往往难以让人满意。尤其针对华为Sound X低音过重的特点,通常的处理方式更是难以奏效,经声智科技独家优化的回声消除算法,可完美解决自噪声中低频部分难消除的问题,从而实现灵敏唤醒、精准识别。

而且,声智科技回声消除算法还具有非常优秀的自适应能力。针对Sound X根据环境位置不同自动切换音效的特色,可兼容多种音效,自动适应不同音效场景下噪声环境的变化,支持随时打断、随时唤醒。

定向拾音,及时响应

在真实使用环境中,5米范围内呼唤“小艺小艺”,华为Sound X都可以及时准确地响应用户指令。无论是播放音乐,还是询问百科、播放儿童读物,又或者是进行智能家居控制,声智科技提供的定向拾音技术都可为用户提供一呼即应的极致唤醒体验。即便在播放大音量音乐或多人聊天场景下,定向拾音技术也可以保障产品实现5米范围内全方位捕捉声音,自动识别说话者方位,及时响应反馈。

对于智能音箱而言,音质的提升,不能以牺牲智能体验为代价。声智科技为华为Sound X独家提供的降噪唤醒技术,以声源定位、波束形成、噪声抑制、混响消除等算法为核心,在嘈杂环境下依然可以准确识别用户指令。通过优化波束形成、声源定位等核心算法以提供优质的定向拾音技术,屏蔽来自环境中的噪声干扰,提高语音信号处理质量。因此,保障了华为Sound X在各种复杂场景下,依然具有很高的唤醒率和识别率,其远场拾音性能达到业内领先水平,具有很好的场景适应性。例如在多人聊天场景中,该技术可根据说话人的语音特点如距离、语调、语速等,进行相应处理,保障产品支持精准定向的唤醒识别服务。

同时,声智科技还提供了独家优化的唤醒模型,采用新的算法策略,有效平衡真实使用场景中的高误唤醒和低唤醒率问题,解决“难唤醒”、“乱唤醒”的状况。从而确保在复杂的噪声环境中,华为Sound X依然可以提供优质的智能交互服务体验。

空间感知,随声而动

华为Sound X另一重要突破在于,无论将其放置于房间哪个位置,均可以根据音箱所处位置进行音效的自动调节。如当音箱位于房间中间时,自动营造出360°均匀声场;当音箱靠近墙壁放置,则自动模拟出5.1家庭影院全景声音效。这一优秀的空间智慧感知能力背后也离不开声智科技提供的降噪唤醒技术。处于不同的空间位置,会面临不同的噪声环境,既包括空调等平稳噪声,也包括人声交谈等非稳态噪声,还需要面对不同环境下造成的混响的差异。

在这种情况下,为保证Sound X稳定高质的智能交互体验,就要求降噪唤醒等核心技术具有非常优秀的适应能力以及兼容性。声智科技独家优化的智能交互技术便有效解决了该问题,通过特殊处理方式,最大程度地减少了环境变化造成的智能交互体验效果的下降。而且,声智科技已经突破了常见的均匀声场和麦克风顶制的算法约束,通过Inverse Array(倒置麦克风阵列)、Vibrated AEC(动态声场回声消除)、Penetrated DOA(穿透式波达方向估计)、OpenAEC(开放声场回声消除)、TVNS(TV Noise Suppression)等独有技术,释放出智能产品形态的更多可能,而这些技术也已经在腾讯智能机器人、阿里天猫精灵魔盒等多个产品中得到了量产验证。

华为Sound X智能音箱搭载声智科技领先的智能交互技术,实现了音效和智能体验双突破。此外,声智科技可提供包括一站式智能音箱解决方案,包括远场声学处理、远场语音唤醒、远场语音识别、远场双工通话、自然语言理解、自然语音合成等在内,以量产验证的成熟方案,为客户提供优质服务。

不仅如此,声智科技还提供SoundAI Azero智能操作系统,内置麦克风阵列、远场语音唤醒、远场语音识别、自然语言处理、远场语音合成、声纹识别等算法,默认集成了信息查询、影音娱乐、IOT控制等200+项常用技能与服务,经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。并且,声智科技可为垂直场景客户提供一站式的行业解决方案,例如智慧教育、智慧金融、智慧文旅、智能家居等。

自2018年声智科技与华为第一次合作以来,双方强强联合推出了华为AI音箱、华为荣耀YOYO智能音箱、华为AI音箱mini等多款产品,不断推动技术和场景落地突破,获得了市场和消费者的高度认可。

关于声智科技

声智科技成立于2016年5月,是融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,致力于连接有价值的信息、服务与设备,让智能服务随处可享。

声智科技拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、自然语言理解、自然语音合成、超远场声学监控、智能搜索与个性化推荐、知识图谱与智能分析、精准用户时空画像等自主核心技术,已经服务120多个客户1600万台智能设备,经过百亿次人机交互真实场景的规模验证,可为家居、办公、出行、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。


http://www.niftyadmin.cn/n/3573273.html

相关文章

MySQL5.6与5.7的区别——及MySQL5.6版本安装

一、MySQL5.7对比5.6的优势1.安全性2.灵活性4.易用性5.可用性6.性能优势7.默认参数的改变8.安装不同二、MySQL 5.6 的安装步骤1.查看并解压源码包2.安装环境3.CMAKE编译并安装4.配置my.cnf和启动脚本5.添加环境变量6.创建程序账号,并授权7.初始化MySQL配置8.开启数据…

51nod 1416:两点 深搜

1416 两点题目来源: CodeForces基准时间限制:1 秒 空间限制:131072 KB 分值: 20 难度:3级算法题收藏关注福克斯在玩一款手机解迷游戏,这个游戏叫做”两点”。基础级别的时候是在一个nm单元上玩的。像这样: …

四川轻工与计算机学院校训,常州轻工职业技术学院校训及含义:诚信 笃实 勤俭 创新...

校训历来是一所学校珍贵的价值遗产和宝贵的精神财富,是一所学校精神的集中表达。新东方在线高考网特别整理了常州轻工职业技术学院校训,供参考!诚信 笃实 勤俭 创新——常州轻工职业技术学院校训。校训是一所学校长期以来办学理念、办学风格的…

mysql数据库主从同步(非交互式)

mysql数据库主从同步非交互式配置步骤,本文以一台mysql数据库多实例3306和3308为例进行配置,3306为主库,3308为从库(多台单实例与一台多实例配置是一样的)一.my.cnf文件配置1.修改my.cnf配置文件,主数据库3…

LeetCode 1232、缀点成线

1232、缀点成线 1)题目描述 给定一个数组 coordinates ,其中 coordinates[i] [x, y] , [x, y] 表示横坐标为 x、纵坐标为 y 的点。请你来判断,这些点是否在该坐标系中属于同一条直线上。 示例 1: 输入:…

java并发编程 性能与可伸缩性_Java并发编程实战 第11章 性能与可伸缩性

关于性能性能的衡量标准有很多,如:服务时间,等待时间用来衡量程序的"运行速度""多快"。吞吐量,生产量用于衡量程序的"处理能力",能够完成"多少"工作。多快和多少有时候是互相…

计算机无法共享没有启动不,windows共享文件时右键不出现共享没有共享的选项...

windows右键不出现共享的解决方法问题现象:当我们想在window2003下共享文件时,发现右击文件夹,并没有“共享”的选项解决步骤:首先验证:A.是否administrator身份登录本地连接属性,B.“文件打印机共享”的服…

java annoataion_Java 注解(Annoation)学习笔记

1 Junit中的Test为例:1.1 用注解(Test)前private booleanisTestMethod(Method m) {returnm.getParameterTypes().length 0 &&m.getName().startsWith("test") &&m.getReturnType().equals(Void.TYPE);}用注解前(Junit4之前),J…