【论文阅读】Semi-Supervised Learning with Ladder Networks

搜索软件开发资讯 2024-01-04 19 0

论文地址: Semi-Supervised Learning with Ladder Networks 会议: NIPS 2015 任务: 半监督分类

1. 摘要

我们将监督学习与深度神经网络中的无监督学习相结合。所提出的模型经过训练，可以通过反向传播同时最小化监督和非监督成本函数的总和，从而避免了分层预训练的需要。我们的工作建立在 Valpola 提出的梯形网络之上，我们通过将模型与监督相结合来扩展该梯形网络。

2. 算法描述

本文主要是在前任的深度半监督模型上，添加了一些适配以完成半监督任务。阅读这篇论文需要一些前置知识，貌似是有两个版本，一个是会议的（NIPS）,内容精炼，不太容易读懂；还有一个版本，是arxiv的，较为详细。

结合这两张图，大致的计算流程算是比较清晰了。

这里主要是讨论一下算法中对于损失的计算。

输入数据：有标签数据：

{

(

)

(

)

∣

≤

}

\{\mathbf{x}(n), t(n) \mid 1 \leq n \leq N\}

{x(n),t(n)∣1≤n≤N} 其中，对于任意样本

(

)

\mathbf{x}(i)

x(i)的标签为

(

)

t(i)

t(i)，

≤

1 \leq i \leq N

1≤i≤N。无标签数据：

{

(

)

∣

≤

}

\{\mathbf{x}(n) \mid 1 \leq n \leq N\}

{x(n)∣1≤n≤N}

(1)

C=C_{\mathrm{c}}+C_{\mathrm{d}}\tag{1}

C=Cc+Cd(1) 首先，损失分为两个部分，一个是有监督的损失

C_{\mathrm{c}}

Cc，另外一个是无监督的损失

C_{\mathrm{d}}

Cd。

−

∑

log

⁡

(

)

∣

(

)

(2)

C_{\mathrm{c}}=-\frac{1}{N} \sum_{n=1}^{N} \log P(\tilde{\mathbf{y}}=t(n) \mid \mathbf{x}(n))\tag{2}

Cc=−N1n=1∑NlogP(y~=t(n)∣x(n))(2) 这个是有监督损失，是分类常用的交叉熵损失。其中，

\tilde{\mathbf{y}}

y~表示的感觉有点问题，是说对一个样本的预测值，没什么没有下标。

∑

(

)

∑

∥

(

)

(

)

−

(

)

(

)

∥

(3)

C_{\mathrm{d}}=\sum_{l=0}^{L} \lambda_{l} C_{\mathrm{d}}^{(l)}=\sum_{l=0}^{L} \frac{\lambda_{l}}{N m_{l}} \sum_{n=1}^{N}\left\|\mathbf{z}^{(l)}(n)-\hat{\mathbf{z}}_{\mathrm{BN}}^{(l)}(n)\right\|^{2}\tag{3}

Cd=l=0∑LλlCd(l)=l=0∑LNmlλln=1∑N∥∥∥z(l)(n)−z^BN(l)(n)∥∥∥2(3) 这个是无监督损失，损失定义了不同层经过去噪与干净数据前向值的差异的加权和，其中权值定义了每个层损失的重要程度不同。

Notice：在论文实验中，处理的数据集是MNIST，但是在论文中表述的确是"permutation invariant MNIST"。经过多方检索，确认应该是对于手写数字图片的像素点不知道二维位置信息，也就是说无法经过卷积提取特征，可以理解为图片像素被强行展开成一维向量，所以在原文中会说该任务相较于原任务更难。

精彩内容

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

论文阅读 semi-supervised ladder network

本文由用户于 2024-01-04 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/17823875.html

金钥匙

【论文阅读】Semi-Supervised Learning with Ladder Networks

人工智能论文阅读二——基于全脸外观的凝视估计

论文阅读自动驾驶深度学习计算机视觉【论文笔记】Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Application

发表评论取消回复

金钥匙

【论文阅读】Semi-Supervised Learning with Ladder Networks

人工智能 论文阅读二——基于全脸外观的凝视估计

论文阅读 自动驾驶 深度学习 计算机视觉 【论文笔记】Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Application

相关文章

发表评论取消回复

人工智能论文阅读二——基于全脸外观的凝视估计

论文阅读自动驾驶深度学习计算机视觉【论文笔记】Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Application