人工智能知识图谱的嵌入：TransE

下面对知识图谱的嵌入模型TransE进行原理讲解，文末提供完整全注释版代码。

TransE模型原理

知识图谱首要任务是知识图谱的嵌入，知识图谱的嵌入中，最为经典的模型就是TransE模型，TransE模型的核心作用就是将知识图谱中的三元组翻译成embedding向量

该模型的基本思想是使head向量和relation向量的和尽可能靠近tail向量。这里我们用L1或L2范数来衡量它们的靠近程度。

理解下来也就是：

首先，确定训练集，超参数γ，学习率λ

初始化关系向量与实体向量，对于每个向量的每个维度在 [ -6/√k，6/√k）内随机取一个值，k为低维向量的维数，对所有的向量初始化之后要进行归一化

进入循环：采用minibatch，一批一批的训练会加快训练速度，对于每批数据进行负采样（将训练集中的三元组某一实体随机替换掉），T_batch初始为一个空列表，然后向其添加由元组对（原三元组，打碎的三元组）组成的列表： T_batch = [ ( [h,r,t], [h',r,t'] ), （[ ], [ ]）, ......]

拿到T_batch后进行训练，采用梯度下降进行调参

TransE 定义了一个距离函数 d(h + r, t)，它用来衡量 h + r 和 t 之间的距离，在实际应用中可以使用 L1 或 L2 范数。在模型的训练过程中，transE采用最大间隔方法，最小化目标函数，目标函数如下：

其中，S是知识库中的三元组即训练集，S’是负采样的三元组，通过替换 h 或 t 所得，是人为随机生成的。γ 是取值大于0的间隔距离参数，是一个超参数，[x]+表示正值函数，即 x > 0时，[x]+ = x；当 x ≤ 0 时，[x]+ = 0 。算法模型比较简单，梯度更新只需计算距离 d(h+r, t) 和 d(h’+r, t’)。

免费获取代码：

链接：https://pan.baidu.com/s/1qogwPPT_jFpUtzXDonvMkA?pwd=2222 提取码：2222 --来自百度网盘超级会员V4的分享

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

金钥匙

人工智能知识图谱的嵌入：TransE

vue.js vue+django+neo4j 基于知识图谱红楼梦问答系统

知识图谱大数据新兴技术在金融领域（反洗钱）的应用

发表评论取消回复

金钥匙

人工智能 知识图谱的嵌入：TransE

vue.js vue+django+neo4j 基于知识图谱红楼梦问答系统

知识图谱 大数据 新兴技术在金融领域（反洗钱）的应用

相关文章

发表评论取消回复

人工智能知识图谱的嵌入：TransE

知识图谱大数据新兴技术在金融领域（反洗钱）的应用