文章链接

原文:arXiv:2312.13596v1 [cs.LG] 21 Dec 2023

代码:github.com/ZhixiangSu/APST

一 、动机与贡献

文章使用锚定路径辅助归纳推理,以往路径方法只考虑闭环路径。一是在高度不完整图谱中闭环较少,性能下降。另外非闭环路径(锚定路径)是重要的证据。使用了两种路径和外部文本信息。

1. 定义了锚定路径(AP)和两个评价指标,即AP准确性和AP召回率

2. 设计了APST句子转换器,它接受AP和CP的输入,并从公共网站捕获的外部文本知识

归纳推理 :对训练中每见过的实体进行推理,训练集、测试集实体最好不重复

闭环路径:给定一个三元组h,r,t ,找到一条h到t的路径是闭环路径

锚定路径 :与h或t相连的路径就是,闭环路径是锚定路径的子集

闭环路径CP

锚定路径AP

锚定路径是重要证据:

图1   对于三元组(Morgan,Profession,Actor)  , 其获奖情况,所属公司都能说明他的职业

二、整体流程

图2 整个流程

主要分两步:1、 筛选锚定路径  2、用transformer将路径转化为嵌入

三、锚定路径获取与筛选

两种路径都通过随机游走获取,但不是所有锚定路径都有用。需要筛选通过AP准确性和AP召回率

对于(Morgan,Profession,Actor) ,比如出生信息,和性别信息:

查询的形式是(hq ,rq ,?)?代表tq ,我们关注通过路径推导查询关系rq。下是衡量一个锚定路径是否合理:

1、找出所有具有rq的头实体:

2、找到具有某一种锚定路径的头实体 , 会有多种锚地路径

根据这两个集合可以对所有实体进行划分,1、该实体是否连接查询关系 2、该实体是否连接这条锚定路径。分为4类:

AP准确度:如果AP路径有效,AP路径出现总是伴随着问题关系的出现

AP召回率:同时问题关系的出现也伴随着AP出现

使用两种指标可以获取更好的AP

四、路径转化

要将路径信息和外部文本信息转化为嵌入,才能预测。将路径、实体、文本描述、三元组输入到transformer来获取嵌入, 对比嵌入的相似度作为预测得分。训练是修改transformer的参数。

D 文本细节描述

来源于通过API在Google上搜索

e 路径上的实体

只要CP添加所有实体,其他只有头尾,头尾实体最有意义,只在这两处添加细节描述

r 关系

q代表来自查询,之前提过

输入transformer后就得到了对应嵌入,S ,对一条AP分数:

实体的预测结果是考虑所有AP作为证据:

注意:CP是AP的子集,上述求分数以包含对CP的求解

训练损失,越低越好

五、实验结果与消融

两个指标越高越好

最后结果(绿点)一般在右侧,说明了AP的有效性。

(i) SC:仅包含 CP 的简短描述

(ii) SA:包含 AP 的简短描述

(iii) DC:仅包含 CP 的详细说明

(iv) DA:包含 AP 的详细说明。

END

好文阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: