百度朱凯华：智能搜索和对话式OS技术解读（二）

现代搜索引擎面临两个重要挑战：

1．更好的建模搜索结果的语义相关性；

2．更直接地给用户答案。

前文：1．智能搜索和对话式OS技术解读（一）

本文：2．通过知识的帮助来给用户直接答案

演讲主要集中在以下两个部分：

AI赋能的现代搜索引擎——百度搜索

AI赋能的对话式交互计算机——DuerOS系统

这边对比一下百度在知识图谱上的推理能力。

百度支持『主语＋谓词』方式的推理，例子是『刘德华的老婆』，百度和Google都能给出答案。但从产品上百度更丰富的给出答案的详细信息。

百度支持『谓词＋取值范围』方式的推理，例子是『180cm以上的男明星』，百度能够给出符合要求的明星列表，Google不能给出答案。

百度支持『谓词＋排名』方式的推理，例子是『世界第五／第八／第十高峰』，百度能够给出符合要求的知识图谱卡片，Google给出的答案结构不一（有些是知识图谱卡片，有些是web answer卡片）。

百度支持多步推理，例子是『谢霆锋的爸爸的儿子的前妻的年龄』，百度能够通过多步推理给出答案，而Google不能给出答案（虽然真实用户不太会真的这样搜索百度，但是这个例子体现的是能力的差异）。

如何进行基于知识图谱的推理，这方面讨论很多，不多赘述。简言之就是按照知识先分析关系，然后在知识图谱上解释执行获取答案。上面的例子是『谢霆锋是谁的儿子』和『谢霆锋的儿子是谁』，虽然这两句话用词差不多，但是依存分析（Dependency Parsing）的解释完全不同，依据依存分析的解释，百度能够执行知识图谱查询并且获得正确的答案。

基于知识图谱推理的两大限制及三种解决方案

举个例子，看到『Bush wives』大家会猜到什么？一般都会理解为『小布什／老布什的老婆』（虽然wives复数有点奇怪）。包括Google在2015年的时候也是这么理解的（2015年WSDM演讲时的截图，后来Google修复了这个例子），但是如果仔细看一下头几条搜索结果，大家就会发现，bush wives讲的是非洲内战时，被掳获到丛林中充当慰安妇的妇女。

这就是典型的知识图谱的盲区问题，一旦某概念不在知识图谱其中，知识图谱会做一个它自己尽可能好的解释，但他可能和真正的解释相差很多。（一个类似的中文例子是『从百草园到三味书屋』，中国地大物博，确实有地名叫百草园，也有三味书屋，一个只关注地理位置POI的知识图谱就会觉得他是一个完美匹配导航需求的Query。但放大来看，大家都知道他是鲁迅的一篇散文。）