首页 > 社交 > 科普中国

华为史佳欣:基于知识图谱的复杂问题推理问答

常驻编辑 科普中国 2022-05-30 图谱   詹姆斯   华为   知识   骨架   实体   问答   领域   过程   关系   数据   公司   史佳欣
通过问题生成,我们得到了大量的模板问题以及问题对应的SPARQL, KoPL, 选项和标准答案。下一步对模板问题众包转写,在保持原意的前提下,转写得到更加流畅多样的问题。最后对众包转写的结果进行众包评测,评价指标为是否保持问题的原意和转写问题的流畅性,我们会丢弃未保持原意的问题,比如转写二“勒布朗·詹姆斯的个子是不是比他儿子高?”,这个转写将问题的答案变为是或否。jhY拜客生活常识网

最终我们得到了约12万条五元组数据,将其命名为KQA Pro,是目前首个包含了自然语言、全知识类型、多种逻辑形式的大规模数据集。jhY拜客生活常识网

3. 下一个问题jhY拜客生活常识网

jhY拜客生活常识网

以上是我们探讨的第一个问题——如何构造大规模推理过程数据。在拥有领域一的推理过程数据之后,我们思考这些数据是否可以帮助其他领域学习推理过程?在这些领域里,已经有了一些问题和答案,但缺乏推理过程,比如是否可以使用金融领域的推理过程数据帮助医学领域的推理过程学习?jhY拜客生活常识网

--jhY拜客生活常识网

03jhY拜客生活常识网

跨领域迁移jhY拜客生活常识网

这是我们分享的第二个问题,我们希望将已有的推理过程迁移到其他领域中。jhY拜客生活常识网

1. 跨领域迁移jhY拜客生活常识网

jhY拜客生活常识网

考虑在KoPL推理过程的跨领域迁移,我们将推理过程划分为两个部分:jhY拜客生活常识网

  • 第一个部分是推理过程的骨架指的是图谱的基本操作,比如问题“AI行业哪家公司2021年融资最多?”对应的KoPL有四个操作,第一个操作是找到知识图谱中对应AI行业的实体,第二个操作是通过关系找到跟AI行业具有所属关系的实体,这个操作可以找到跟AI行业相关的实体,比如公司、高校或从业人员等,第三个操作是对概念进行过滤,得到行业的所有公司,最后第四个操作是从公司里去比较属性“2021年融资”,从中选出属性值最大的实体。
  • 第二个部分是推理过程的参数指的是骨架中每个操作选取的内容,比如Concept选择了公司,公司就是一个参数。

jhY拜客生活常识网

通过将推理过程分解这样两个部分之后,我们发现了

相关阅读:

  • 科技资讯|祝融号发现火星水活动痕迹;迄今最全跨组织细胞
  • 还没毕业,就被裁员了?
  • 大脑神经网络亚细胞图谱构成
  • 科学家发现:宇宙和人脑的图谱离奇相似,宇宙和人脑都有共
  • 安武林:枕边书
  • 红杉中国300亿A股投资图谱曝光!多个项目带来数百倍回报
  • 百度屡提的知识管理,能引领办公风向吗
  • 我科学家率先绘就家蚕超级泛基因组图谱
  • SoulApp回归社交本源
  • 最全手诊图谱,一看就懂,简单实用!不出门也能望手察病!收了
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。