• 发文
  • 评论
  • 微博
  • 空间
  • 微信

AI赋能,发布四款消费类新品!科大讯飞如何"顶天立地"?

新物种说 2020-09-02 10:03 发文

对科大讯飞的认知,大多数人还停留在中国最大的智能语音技术提供商的层面。实际上,科大讯飞在多个领域都有广泛布局,现已推出覆盖全行业的智能产品及服务,引领在消费者、智慧教育、智慧城市、智能客服、智能汽车、智慧医疗、智能家居等领域的深度应用,占有中文语音技术市场70%以上的市场份额。

随着AI、IoT以及5G等前沿技术的发展,科大讯飞正推动语音及语言、自然语言理解、机器学习推理及自主学习等核心技术与各行业的结合,用AI技术重新赋能传统硬件,从而为用户带去软硬结合的极致体验。

9月1日,科大讯飞在"声来即王者"的消费类新品发布会上,连续推出讯飞智能录音笔SR901、SR702、SR101,讯飞首款智能TWS耳机iFLYBUDS四款新品。科大讯飞轮值总裁胡郁在现场解读了科大讯飞"顶天立地"的含义,"顶天"就是人工智能核心技术要保持全球领先。"立地",是不仅有技术,还要它真正变成产品,为广大用户产生价值。而这四款新品正承载了科大讯"To B+To C"的双轮驱动战略,让AI应用服务大众的初衷。

聚焦AI转写赛道,消费者业务发力

科大讯飞此次发布三款智能录音笔新品,补全了智能录音笔全系列,覆盖了从入门、旗舰再到尊享版全线机型。更重要的是,经过AI的赋能,解决了传统录音笔存在的痛点。

讯飞智能录音笔SR101是面向职场新人和学生推出的入门级新品,标配1.4英寸触摸屏使得转写实时可见,同时搭载1颗定向麦克风+2颗矩阵麦克风的组合,四核处理芯片,8GB存储空间和1500mAh电池容量,在硬件配置上毫不妥协。SR101售价599元,转写终身免费并享有3年5GB云空间服务。

讯飞智能录音笔SR702为旗舰新品,拥有一体设计的3D陶瓷背板和航空级铝合金,其采用高密度2600mAh大容量电池,搭载2颗定向麦克和6颗矩阵麦克风,配置3.5英寸高清屏幕,并配备800万像素数字变焦后置摄像头。

讯飞智能录音笔SR901则是尊享版,采用钢琴黑全陶瓷机身,搭载6.01英寸AMOLED屏幕,64GB存储空间及4000mAh支持18W快充大容量聚合物锂电池。还拥有豪华三摄配置和2颗哈曼MEMS定向麦克风+10颗全向麦克风。通过全面升级的转写引擎。

值得一提的是,SR702和SR901搭载了行业首发的离线转写、OCR图文识别、视频字幕等新功能,再次拓宽了转写记录的易用性和使用场景。此外,三款新品均沿袭了讯飞智能录音笔识别准、录得远、录得清、语种全四大标准。不仅识别准确率达98%,最远拾音距离更是达到了15米。另外,基于AI算法降噪处理前端语音信号,保证拾音的准确性,并提供高清无损音质的音频格式。在关键的语种方面,三款新品都支持12种方言转写、2种少数民族语言转写、8种外语转写,并经过IT科技、医疗、政法、教育等7大专业领域转写优化。

除了三款新品,科大讯飞还发布了首款TWS智能耳机iFLYBUDS。凭借通话实时转写、智能拨号识别、通话译文对照三大核心AI功能,能够轻松满足商务人士在自驾、通勤、会议等多场景中,解放双手、重要信息记录和从容沟通的需求。iFLYBUDS支持智能语音助手,只要说"小飞小飞"即可快速唤醒语音助手。同时iFLYBUDS的特点还包括:支持轻击耳机交互,并且支持自定义功能;佩戴检测,摘下耳机时暂停播放,再次戴上音乐继续。不仅如此,讯飞智能耳机iFLYBUDS续航可以满足日常商务沟通。

iFLYBUDS还充分考虑了应用场景,在常规电话和网络电话会议中,可以实时转写,转写准确率在98%以上。在通话结束后可以形成智能摘要,自动提炼重点内容,还支持对通话内容进行快速查找、多终端分享(手机端和电脑端)和编辑。在外语电话交流场景中,iFLYBUDS打造了堪称逆天的通话译文对照功能。在英语通话时,可将通话内容实时转译为汉字,辅助英语沟通,是你耳朵上的助理翻译官,沟通更加自信、简单。未来将会支持更多的语种。

保持技术领先,方能顶天立地

在科大讯飞副总裁李传刚看来,"技术革新与消费升级双轮驱动,将出现巨大的颠覆式创新机会,并催生新的领导品牌。讯飞智能录音笔和讯飞智能耳机均是这一理念的实践。通过顶尖的AI语音技术、优质的硬件和软件三位一体,打造极致便捷的体验,帮助用户有效提升效率,享受高品质智慧生活。

以转写引擎技术为例,讯飞智能录音笔SR901和SR702两款新品在行业率先搭载了离线转写功能。无需4G/WIFI网络,用户也能实现语音实时转文字、转写后的文字内容即刻保存,离线转写准确率高达95%,无惧断网环境。同时离线转写也防止了高度机密信息的泄露,保障了用户信息安全和特有转写需求的实现。同时,通过SR901和SR702的摄像头可将图片上的文字内容提取出来并实时呈现,便于用户实现重要音频和图文信息的混合记录,用于后期记录及整理。同时,这两款新品还支持录制视频、实时收音并实时生成字幕,同时后期也可编辑字幕,打造多场景重要信息记录的全新AI交互体验。

在讯飞智能录音笔前端降噪处理上,通过讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME),可以有效降低环境干扰噪声。除了硬件,讯飞大力投入语音识别后处理技术并运用到讯飞智能录音笔上,先后上线语气过滤词、口语规整、文本语义分段、文本智能摘要等文本理解能力。针对多人交谈会议场景,上线了分离与ASR联合建模的说话人分离方案,说话人分离的准确率达到95%让用户能够快速检索到目标说话人数据,提升编辑体验。

在人工智能落地过程中,讯飞消费者业务连续三年保持超过30%的高增速。随着讯飞智能硬件产品体系不断完善,C端营收占比在2020年上半年达 37.59%。在AI转写赛道上,讯飞打造的智能硬件成为用户的知识管理工具,并逐步开启高效记录新时代。

严格要求自身,坚持源头技术创新

纵观行业龙头的崛起都离不开企业的核心竞争力,人工智能企业同样如此。为了保持技术领先,科大讯飞一直坚持技术创新,强化企业核心竞争力,在研发投入上已经连续6年超营收20%。据科大讯飞近日发布的2020年上半年财报显示,科大讯飞营收43.49亿元,同比增长2.86%;净利润2.58亿元,同比增长36.28%。财报显示,科大讯飞将其20%的营收约9.62亿元用于研发。

研发,只是保持领先的秘诀之一。从最早的支撑软件及行业应用到教育大赛道,再到目前司法、消费者等明星赛道业务,讯飞不断拓展技术的商业应用领域为他带来了强劲增长。伴随语音交互应用泛化,AI+行业应用深化,更多新增长点值得期待。而胡郁也在前场表示,为了保持公司在人工智能领域的竞争水准,每年都会参加大量的国际比赛,来验证技术创新是否处于源头。以语音转写功能应用到的语音识别技术为例,早在2016年9月,在业界影响力最大、参赛队伍最多、水平最高的国际多通道语音分离和识别大赛CHiME-4中,科大讯飞包揽了全部三个项目的冠军;2018年再次包揽CHiME-5大赛全部四个项目的冠军并大幅刷新了各项目的最好成绩;2020年的CHiME-6,在被称为"史上最难的语音识别任务"中,科大讯飞不仅在给定说话人边界的多通道语音识别两个参赛任务上夺冠,更一鼓作气刷新自己在CHiME-5中46.1%的语音识别错误率冠军成绩,直降至30.5%。

近期在VoxSRC国际说话人识别比赛限定训练数据任务中(公开刷榜阶段),科大讯飞刷新世界纪录,等错误率(EER)降低到0.81%。同时,科大讯飞在学术界公开测试集合VoxCeleb1上取得0.63%的EER,是截止目前的State Of The Art(最好结果),上述两个新纪录表明科大讯飞说话人识别技术站在了世界前列。

曾经中国的科技水平一直处于落后的状态,但在华为、科大讯飞等科技企业的努力赶超,终于在全球领域有了一席之地。而中国科技水平的快速发展让处于"霸主"地位的美国感受到了危机,于是它采用各种手段来阻碍中国科技企业的发展。胡郁也在此次发布会上回应了公司被列入美国实体清单,他表示,科大讯飞坚持源头技术自主创新,拥有的核心技术全部来自科大讯飞的自主研发,拥有自主知识产权。而被列入"实体清单"之后,也并没有对科大讯飞造成多大的影响。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    新物种说

    冷眼看财经,科技猛回首。知来路,...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码