首页 > 社交 > 科普中国

华为史佳欣:基于知识图谱的复杂问题推理问答

常驻编辑 科普中国 2022-05-30 图谱   詹姆斯   华为   知识   骨架   实体   问答   领域   过程   关系   数据   公司   史佳欣
jhY拜客生活常识网

KoPL具有以下四点优势:jhY拜客生活常识网

  • 注重过程:KoPL拆解问题的过程结果都是可见的,而SPARQL是无法定位中间过程的。
  • 符合人类思维:KoPL是一种过程性语言,将一个问题拆分为多个简单问题,然后组合进行解决。
  • 操作具有良好的可组合性:我们将知识图谱的复杂问答拆分为20多个简单操作,这些操作能够互相组合来解决各种各样的问题。
  • 可以面向多种知识来源:除了结构化数据外,还可以对非结构化的文本数据进行操作,比如KoPL还可以对Wikipedia的非结构化文本,描述文本问答的复杂问题的解决过程。

2. 大规模知识库问答数据集——KQA ProjhY拜客生活常识网

jhY拜客生活常识网

基于KoPL的基本操作与组合,我们能够大规模地生成复杂问题,具体生成的策略有四个。第一个策略是模板,比如针对比较类型问题定义这样的模板“<>和<>谁的<属性>更<大/小>”,询问两个人的身高更高就可以套用这个模板,我们可以对这样的模板填充各种实体和属性得到不同的问题。第二个策略是采样,根据第一个策略得到的模板,我们在知识库中进行采样,然后对模板中空缺的位置进行填空,得到不同的问题。第三个策略是组合,根据KoPL的基本操作,我们可以做各种各样的排列组合得到不同的问题。第四个策略是递归,对于问题中已有的实体,我们对其进行递归拆解,增加问题的复杂度,比如将问题“勒布朗·詹姆斯和布朗尼·詹姆斯谁更高?”中的“布朗尼·詹姆斯”使用关系描述为“勒布朗·詹姆斯的儿子”,那么问题就会变为“勒布朗·詹姆斯和勒布朗·詹姆斯的儿子谁更高?”,这样问题的复杂度也就变高了。jhY拜客生活常识网

基于这四种策略,我们可以生成大量多样化的高复杂度问题。jhY拜客生活常识网

jhY拜客生活常识网

最终每个样例生成5个元素,由模板得到的问题,回答问题使用的SPARQL,问题拆解的KoPL,10个候选答案以及标准答案。jhY拜客生活常识网

jhY拜客生活常识网

相关阅读:

  • 科技资讯|祝融号发现火星水活动痕迹;迄今最全跨组织细胞
  • 还没毕业,就被裁员了?
  • 大脑神经网络亚细胞图谱构成
  • 科学家发现:宇宙和人脑的图谱离奇相似,宇宙和人脑都有共
  • 安武林:枕边书
  • 红杉中国300亿A股投资图谱曝光!多个项目带来数百倍回报
  • 百度屡提的知识管理,能引领办公风向吗
  • 我科学家率先绘就家蚕超级泛基因组图谱
  • SoulApp回归社交本源
  • 最全手诊图谱,一看就懂,简单实用!不出门也能望手察病!收了
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。