• 发文
  • 评论
  • 微博
  • 空间
  • 微信

百度ai系列研究:开放能力——自然语言之语言处理应用技术

智先声 2021-08-17 10:54 发文

每周一篇原创,关注5G、物联网、人工智能,跟着我的【头号观点】坚持利用碎片时间学习

今天我们研究百度的自然语言处理能力的语言应用技术,以多场景技术应用为导向,提供可直接应用于产品策略的NLP技术能力,让您的产品更好地理解语言、理解用户。

文本纠错

识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容。

错别字识别与纠正:准确识别输入文本中出现的拼写错别字及其段落位置信息,并针对性给出正确的建议文本内容

多场景纠错支持:支持短文本、长文本、语音识别结果等多种文本内容,在搜索引擎、语音识别、内容审核有广泛应用,能显著提高各场景下语义的准确性和用户阅读体验

场景:将文本纠错嵌入对话系统中,可自动修正语音识别转文本过程中的错别字,向对话理解系统传递纠错后的正确query,能明显提高语音识别准确率,使产品整体体验更佳。

情感倾向分析

对包含主观信息的文本进行情感倾向性判断,可支持在线训练模型调优效果,为口碑分析、话题监控、舆情分析等应用提供帮助

情感分析通用模板:针对通用场景下带有主观描述的中文文本,自动判断该文本的情感极性类别并给出相应的置信度,情感极性分为积极、消极、中性

情感分析定制版:支持用户使用适合自身应用场景的情感极性标注语料,在通用模型基础上进行优化训练,满足专属场景的更高准确率要求

多实体情感分析:针对特定场景下带有主观描述的篇章文本,自动识别文本中的核心实体词,并分别判断每个实体词对应的情感和对应置信度

场景:通过对需要舆情监控的实时文字数据流进行情感倾向性分析,把握用户对热点信息的情感倾向性变化

评论观点抽取

自动抽取和分析评论观点,帮助您实现舆情分析、用户理解,支持产品优化和营销决策

(点击看大图)

场景:对楼盘点评内容进行观点提取和分析,为每个楼盘定义点评标签,让购房者和开发商直观了解楼盘在用户中的口碑

新闻摘要

基于深度语义分析模型,自动抽取新闻文本中的关键信息并生成指定长度的新闻摘要。可用于热点新闻聚合、新闻推荐、语音播报、APP消息Push等场景

全面分析新闻语义:结合传统语义特征和深度学习模型,充分考虑段落分布和篇章结构,准确计算新闻语句的重要性,对新闻内容进行全面的语义理解与分析

自动抽取摘要文本:能根据需求灵活控制摘要长度,自动抽取关键信息,形成摘要结果。可用于内容理解、内容分发、智能写作等多种应用,是智能媒体等行业必备AI能力之一

场景:通过对大量的新闻文本进行语义分析和快速摘要,可以快速形成热点汇总类、新闻聚合类、事件盘点类的新闻稿件,进行自动写作和辅助写作,提升新闻生产效率

总结

自然语言能否做成一个中台?是各厂家一直探索的场景,从目前市场的应用看是可以做成中台的,如下图所示

通过场景将算法、模型、服务、场景全部串起来,一个模型可以提供一个服务,一个服务或者多个服务可以成为一个场景,通过pipeline进行组合,就可以成为灵活多用的自然语言处理中台,欢迎大家探讨。

免责声明:

本公众号为个人研究专题学习分享,非商业公众号无任何商业目的,如果文章内容有侵权或者非法信息,请立即与本号联系删除谢谢

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    智先声

    新科技观察者与实践者...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码