• 发文
  • 评论
  • 微博
  • 空间
  • 微信

近场声纹识别将普及,本地化的AI能力是刚需

慧谈智能生物识别 2019-10-31 21:32 发文

01 人机交互必须要先唤醒吗?

语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。就目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。比如“小度小度”“若琪”“叮咚叮咚”。那么,人机交互我们必须要先唤醒吗?快商通公检法业务线总经理李稀敏认为:随着技术场景越来越成熟,当机器具备足够的智能化,机器是可以不需要唤醒词,就像跟人对话一样自然。但距离无唤醒交互的实现,还有一段路要走。从声纹识别的角度来看有两种场景,第一种,用唤醒词作为命令词,设备在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步。第二种设置一个“唤醒词”,这时候我们可以将设备唤醒比作水龙头的开关,如果水龙头没有开关的话,摁都摁不住是吧?就像智能音响交互的时候,设备乱七八糟的识别了一大堆语音,这个东西出来摁都摁不住,所以人机交互还是要有“唤醒”步骤。但是否需要唤醒词,还需根据场景的需求来决定,没有所谓的通用答案。

02 声纹识别是否可以改进人机交互方式?

最近一段时间很火的苹果AirPods,华为荣耀FlyPods Pro都在主打身份识别。目前的唤醒大家都是在用这个特定的唤醒词,如果改用声纹识别,是否可以改变这种交互的方式?李稀敏认为:在不同的场景中,最佳的唤醒的方式可以不同,但在耳机等可穿戴设备的场景中,声纹识别因其高易用性、非接触、不需要前置设备等优点,相对其他生物识别技术,能够更好的解决该场景的实际身份认证的问题,进而改进人机交互体验。

03 实现本地端离线语音技术是未来趋势?

“在贴身的耳机,也就是本地端做声纹识别,其实避免了一个技术问题:远场识别”,李稀敏解释。远场的文本无关身份识别由于复杂的信号传播环境等原因,是目前的技术难点,还有很长的路要走。但相对来说,近场的身份识别,在本地端可以通过技术手段快速解决问题。所以,接下来本地端近场身份识别能够大面积普及,在今后很多场景,我们随身携带一个小设备都能够直接识别身份。

关于本地化是不是未来的趋势。从数据的角度来讲,很多人是不希望自己的声音信息,人脸信息,通过设备或各种隐私接口上传到云端且变为不可控。李稀敏认为,从这个角度来看,本地化的AI的能力是一个刚需。

04 大热的语音合成技术TTS,跟声纹识别PK,谁会更胜一筹?

对于使用录音、合成语音等攻击手段的识别,是声纹识别必须要解决的问题。快商通在为银行、保险等金融客户设计声纹身份识别系统,这个是第一个需要解决的问题。

目前,对声纹认证的攻击,大概分成几类,第一类是模仿,第二类是语音合成或者语音转换,第三类是录音重放。根据实际欺诈的手段来讲,目前主要是防录音重放。其中,录音重放是最难检测的。解决了录音重放问题,就相当于解决了语音拼接和语音合成问题。

快商通在这一点上做得比较领先,我们的首席科学家李海洲院士,团队在ASVspoof2017自动说话人验证欺骗和对策挑战赛中获得第一名。包括在许多银行客户的测试中,我们都是100%检测到录音重放。

另外分享个故事,除了算法和系统本身领先,解决方案还需要数据驱动,大量的录音样本、各种设备、各种采样率、各种时长、各种环境的训练。1年前,我们在北京几家银行做测试的时候,白天我们在地铁上,在最嘈杂的环境下,各种测试都攻不破。

但晚上,我住在清华大学里,在10:00、11:00左右夜深人静、一点声音都没有的时候,掏出了我们的APP进行测试,却被攻破了。说明当时我们的训练数据没有覆盖到无杂音、无噪音的情况,当然,现在已经覆盖到了(笑)。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    慧谈智能生物识别

    让人工智能走进每个人的生活...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码