首页 > 社交 > 科普中国

华为史佳欣:基于知识图谱的复杂问题推理问答

常驻编辑 科普中国 2022-05-30 图谱   詹姆斯   华为   知识   骨架   实体   问答   领域   过程   关系   数据   公司   史佳欣
骨架和参数的特点jhY拜客生活常识网

  • 骨架与知识图谱本身是弱相关的,知识图谱一和知识图谱二的领域完全不一样,但在问题的骨架上有相似之处,比如问题一“AI行业哪家公司2021年融资最多?”与问题二“传染病领域哪家医院2021年病人最多?”提问的内容完全不一样,但骨架是类似的。所以我们认为骨架与问题是强相关的,比较容易在跨领域间进行迁移。
  • 参数与知识图谱和问题都是强相关的,例如问题一中的参数均来自金融领域的知识图谱一,问题二中的参数则是来自医学领域的知识图谱二。

2. 骨架解析器jhY拜客生活常识网

jhY拜客生活常识网

对于骨架部分的迁移,我们设计了一个带有注意力机制的Seq2Seq骨架解析器,选用BERT作为编码器,通过注意力机制选取BERT的编码结果,再输入到GRU解码器中,将骨架中的操作逐步解码出来。jhY拜客生活常识网

3. 参数解析器jhY拜客生活常识网

jhY拜客生活常识网

对于参数解析器,我们采取了不同的策略。由于参数与知识图谱是强相关的,所以我们需要对知识图谱中的元素也进行编码,这里使用BERT作为知识图谱元素的编码器。比如上图中,骨架解码器解码得到一个关于Concept的操作,我们将这个解码得到的特征向量与知识图谱中使用BERT编码的概念特征向量作相似度计算,选取相似度最高的概念。上图中相似度最高的是公司,所以最终选择公司作为参数。jhY拜客生活常识网

4. 训练方法jhY拜客生活常识网

jhY拜客生活常识网

我们将模型训练方法分为两个阶段:jhY拜客生活常识网

  • 阶段一,在领域一中进行有监督学习,通过标注好的推理过程数据训练骨架解析器和参数解析器。
  • 阶段二,将阶段一训练好的两个解析器迁移到领域二上,采取强化学习的训练方法,在这个阶段中的训练数据是问答对的形式。对于一个问题,使用骨架解析器和参数解析器进行解析,解析过程中根据概率进行采样,得到不同的推理过程,再将这些不同的推理过程在相应的引擎上执行。比较执行结果与问题答案是否正确,给正确推理过程一个正向奖励,通过强化学习优化正确推理过程的概率,降低错误推理过程的概率。

5. 实验设定jhY拜客生活常识网

jhY拜客生活常识网

下面介绍一下我们的实验设定:

相关阅读:

  • 科技资讯|祝融号发现火星水活动痕迹;迄今最全跨组织细胞
  • 还没毕业,就被裁员了?
  • 大脑神经网络亚细胞图谱构成
  • 科学家发现:宇宙和人脑的图谱离奇相似,宇宙和人脑都有共
  • 安武林:枕边书
  • 红杉中国300亿A股投资图谱曝光!多个项目带来数百倍回报
  • 百度屡提的知识管理,能引领办公风向吗
  • 我科学家率先绘就家蚕超级泛基因组图谱
  • SoulApp回归社交本源
  • 最全手诊图谱,一看就懂,简单实用!不出门也能望手察病!收了
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。