一、什么是实体对齐

在多个来源的知识图谱间寻找相同的实体

二、实体对齐的意义

知识图谱融合的核心步骤, 跨语言实体对齐,丰富小语种KG的信息 跨域实体对齐

三、实体对齐的挑战

1、数据标注

训练模型的种子对齐实体,需要人工标注

ActiveEA 2021 ACL 提出了一种结构感知的不确定性抽样策略RNM AAAI 2021 提出了一个半监督框架,实体对齐和关系对齐可以相互学习,利用关系的语义信息和映射属性来更好地对齐实体SEU EMNLP 2021 基于语义信息把EA看成分配问题,置换矩阵表示Gs和Gt之间的实体对应关系 无监督的方法PRASE IJCAI 2021 无监督的方法,语义信息结合概率推理,选择置信度高的实体映射作为对齐种子S,随后基于这些种子训练语义嵌入模块SelfKG WWW 2022 自监督学习,提出相对相似度度量,尝试将未对齐的实体对推远

2、KG中哪些是有效信息对于EA

预训练模型的实体名表示

结构信息 EASY SIGIR 2021提出了NEAP方案,根据实体名称获得初始EA,通过图结构信息来增强EA结果RePS WWW 2022 提出了一种基于多因素表示学习的EA方法,Relation、Position and Structure aware EAEVA AAAI 2021 利用实体的视觉相似性来创建初始种子字典,无监督

3、计算效率优化

处理20万个节点的KG需要几个小时甚至几天

Dual-AMN WWW 2021 过于复杂的图编码器与效率低下的负采样策略是主要原因,提出了Dual Attention Matching NetworkPSR CIKM 2021 低效的图编码器、负采样困境、半监督学习中的灾难性遗忘,提出了高性能、高扩展性、高鲁棒性的模型PSROn entity alignment at scale VLDB 2021 设计了面向种子的图划分策略LargeEA VLDB 2022 mini-batch生成策略ClusterEA KDD 2022 新的采样策略

4、相似度计算

传统的相似度计算方法:余弦距离、曼哈顿距离、CSLS(Cross-domain similarity Local Scaling)RNM AAAI 2021 利用关系的语义信息和映射属性, SparseFusion ClusterEA KDD 2022 局部和全局相似度归一化,融合多个相似度矩阵的方法来构建相似度矩阵。UPLR WWW 2022 图交互散度

5、动态KG实体对齐

DINGAL AAAI 2021 动态知识图谱对齐,在动态变化的图拓扑结构中有效更新实体嵌入表示,将GCN的参数矩阵看作一个特征变换运算,把变换过程与聚合过程解耦TEA-GNN EMNLP 2021 将关系和时间合并到GNN中TREA WWW 2022使用时间关系注意机制集成方法 Cycle-teaching AAAI 2022 多个对齐器,循环教学KE-GCN WWW 2021 基于知识嵌入的GCN

四、实体对齐的展望

好文链接

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: