文章链接
原文:arXiv:2312.13596v1 [cs.LG] 21 Dec 2023
代码:github.com/ZhixiangSu/APST
一 、动机与贡献
文章使用锚定路径辅助归纳推理,以往路径方法只考虑闭环路径。一是在高度不完整图谱中闭环较少,性能下降。另外非闭环路径(锚定路径)是重要的证据。使用了两种路径和外部文本信息。
1. 定义了锚定路径(AP)和两个评价指标,即AP准确性和AP召回率
2. 设计了APST句子转换器,它接受AP和CP的输入,并从公共网站捕获的外部文本知识
归纳推理 :对训练中每见过的实体进行推理,训练集、测试集实体最好不重复
闭环路径:给定一个三元组h,r,t ,找到一条h到t的路径是闭环路径
锚定路径 :与h或t相连的路径就是,闭环路径是锚定路径的子集
闭环路径CP
锚定路径AP
锚定路径是重要证据:
图1 对于三元组(Morgan,Profession,Actor) , 其获奖情况,所属公司都能说明他的职业
二、整体流程
图2 整个流程
主要分两步:1、 筛选锚定路径 2、用transformer将路径转化为嵌入
三、锚定路径获取与筛选
两种路径都通过随机游走获取,但不是所有锚定路径都有用。需要筛选通过AP准确性和AP召回率
对于(Morgan,Profession,Actor) ,比如出生信息,和性别信息:
查询的形式是(hq ,rq ,?)?代表tq ,我们关注通过路径推导查询关系rq。下是衡量一个锚定路径是否合理:
1、找出所有具有rq的头实体:
2、找到具有某一种锚定路径的头实体 , 会有多种锚地路径
根据这两个集合可以对所有实体进行划分,1、该实体是否连接查询关系 2、该实体是否连接这条锚定路径。分为4类:
AP准确度:如果AP路径有效,AP路径出现总是伴随着问题关系的出现
AP召回率:同时问题关系的出现也伴随着AP出现
使用两种指标可以获取更好的AP
四、路径转化
要将路径信息和外部文本信息转化为嵌入,才能预测。将路径、实体、文本描述、三元组输入到transformer来获取嵌入, 对比嵌入的相似度作为预测得分。训练是修改transformer的参数。
D 文本细节描述
来源于通过API在Google上搜索
e 路径上的实体
只要CP添加所有实体,其他只有头尾,头尾实体最有意义,只在这两处添加细节描述
r 关系
q代表来自查询,之前提过
输入transformer后就得到了对应嵌入,S ,对一条AP分数:
实体的预测结果是考虑所有AP作为证据:
注意:CP是AP的子集,上述求分数以包含对CP的求解
训练损失,越低越好
五、实验结果与消融
两个指标越高越好
最后结果(绿点)一般在右侧,说明了AP的有效性。
(i) SC:仅包含 CP 的简短描述
(ii) SA:包含 AP 的简短描述
(iii) DC:仅包含 CP 的详细说明
(iv) DA:包含 AP 的详细说明。
END
好文阅读
发表评论