Matlab中的深度学习——CNN图像分类实例

我测试了一下，matlab2022a 可以运行。matlab2018之后的应该都可以。因为CNN是比较简单，比较经典的网络。matlab很早就支持了

一起来学习一个Matlab环境下运用卷积神经神经网络(CNN)实现图像分类的小栗子，力争用最通俗的语言进行解释，闲话不多说，咱直接上干货。

环境要求：Matlab2018a及以上版本(18a版本开始提供Deep Learning Toolbox的工具箱，正式拉开了Matlab进军深度学习领域的序幕)；

数据集：大多图像分类的Benchmark数据集都会使用到MNIST，但是由于使用的实在太多了，以及分类的难度确实不大，所以我们今天分享一个相似的但是难度稍大的数据集，名字叫notMNIST，附上数据集的链接：

http://yaroslavvb.blogspot.com

代码部分：

为了尽可能的把demo写的浅显易懂，也为了其他小伙伴可以直接套用此模型来跑自己的数据，我们尽可能地不使用复杂晦涩的函数，努力做到步子小一点，注释多一点。

demo中使用的数据集（下载后和程序放在一个文件夹下，不用改路径，直接运行程序即可）：

链接：https://pan.baidu.com/s/1JnS6yfnoxTNg1d0_atpGHg

提取码：hw89

% 数据集来源：

% http://yaroslavvb.blogspot.com/2011/09/notmnist-dataset.html

% matlab deep learning toolbox 官方使用说明：

% https://www.mathworks.com/help/deeplearning/ref/trainnetwork.html#d120e82918

% 知乎：夏明朗 2020-05-29

clc

clear

close all

% 读取数据

load('notMNIST_small.mat')

% 选取部分数据可视化

for i=1:1:32

subplot(4,8,i);

imshow(images(:,:,555*i)/255)

end

X = reshape(images, [28,28,1,length(images)]); % 灰度图片的作为输入的要求为h*w**c*s,

% 其中h为图片的长度，w为宽度，c为通道数，s就是数据的个数

size(X) % 可以看到我们的数据集尺寸为：28*28*1*18724

Y = categorical(labels); % 标签的数据类型为categorical

idx = randperm(length(images)); % 产生一个和数据个数一致的随机数序列

num_train = round(0.5*length(X)); % 训练集个数，0.5表示全部数据中随机选取50%作为训练集

num_val = round(0.3*length(X)); % 验证集个数，0.3表示全部数据中随机选取30%作为验证集，故测试集自动变为剩下的20%

% 训练集，验证集和测试集数据

X_train = X(:,:,:,idx(1:num_train));

X_val = X(:,:,:,idx(num_train+1:num_train+num_val));

X_test = X(:,:,:,idx(num_train+num_val+1:end)); %这里假设，全部数据中除了

% 训练集，验证集和测试集标签

Y_train = Y(idx(1:num_train),:);

Y_val = Y(idx(num_train+1:num_train+num_val),:);

Y_test = Y(idx(num_train+num_val+1:end),:);

以上代码主要实现了数据的导入以及数据集的随机划分，未使用一步到位的函数，这样大家就可以在工作区清楚的看到每一步是怎样实现的。这里解释randperm( )函数，其可随机产生一个和样本个数相同数目的序列，例如共有10个样本，那么randperm(10)的结果可能为

8 3 10 5 2 4 1 7 9 6

因此我们使用这个随机序列就可以实现数据集的随机划分，本程序设置训练集数据占50%，验证集数据占30%，测试集数据就占剩余的20%。数据集准备完成后，我们就开始搭建CNN网络

%% 定义网络层

layers = [...

imageInputLayer([28,28,1]); % 输入层，要正确输入图片的height, width 和 number of channels of the images

batchNormalizationLayer(); % 批量归一化

convolution2dLayer(5,20); % 卷积层

batchNormalizationLayer();

reluLayer() % Relu激活函数

maxPooling2dLayer(2,'Stride',2); % 池化层

fullyConnectedLayer(10); % 全连接层

softmaxLayer(); % softmax层

classificationLayer(),...

];

这里定义的CNN网络又1个卷积层、1个池化层和1个全连接层组成，其中还使用了批量归一化操作，当然也可以加入dropout来防止过拟合。至于网络结构的设计就属于“炼丹”的范畴了，没有一个统一的标准，因人而异，需要大家自己慢慢体会了。

下面我们简单介绍没有验证集和有验证集的区别：

没有验证集情况

% 参数

options = trainingOptions('sgdm',... % 也可以用adam、rmsprop等方法

'MaxEpochs',50,... % 最大迭代次数

'Plots','training-progress');

net_cnn = trainNetwork(X_train,Y_train,layers,options);

没有验证集曲线，我的电脑就一个GPU。训练非常快。Matlab2022非常强大，自动调用GPU，不需要配置。

没有验证集合训练过程会迭代到最大迭代步数，并且左侧图像中没有验证集的曲线。这里有一个问题，如果我们遇到复杂的问题，模型中又缺少防止过拟合的操作（批量归一化，dropout，正则化或大数据集都可以防止过拟合），那么最终结果极有可能会出现过拟合，这当然是我们不想出现的情况。因此，如何判断模型训练是否“恰到好处”，我们应该引入验证集帮助我们进行判断。

有验证集的情况

% 参数

options = trainingOptions('sgdm',... % 也可以用adam、rmsprop等方法

'MiniBatchSize',128, ...

'MaxEpochs',50,... % 最大迭代次数

'ValidationData',{X_val,Y_val},... % 显示验证集误差

'Verbose',true, ... % 命令窗口显示训练过程的各种指标

'Shuffle','every-epoch', ...

'InitialLearnRate',1e-2,...

'Plots','training-progress');

net_cnn = trainNetwork(X_train,Y_train,layers,options);

options 中我们加入了更多的人为设置的参数，这样稍微高级的定义会使得模型训练的更符合你的要求。加入验证集后，我们可以看到训练过程“早停”了，Epoch只迭代了8次模型就训练过程就结束了，原因如绿框内容所示，Patience为5表示：如果5步迭代中验证集的loss都没有减小的话，训练就终止了。在绝大数情况下，这种早停的机制会防止模型过度训练从而出现过拟合的现象。

最终我们使用测试集验证模型的泛化能力即可，相应代码与结果如下

% 测试

testLabel = classify(net_cnn,X_test);

precision = sum(testLabel==Y_test)/numel(testLabel);

disp(['测试集分类准确率为',num2str(precision*100),'%'])

在单 GPU 上训练。

正在初始化输入数据归一化。

｜＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝｜

｜　　轮　　｜　　迭代　　｜　　　　经过的时间　　　　　｜　　小批量准确度　　｜　　验证准确度　　｜　　小批量损失　　｜　　验证损失　　｜　　基础学习率　　｜

｜　　　　　｜　　　　　　｜　　（ｈｈ：ｍｍ：ｓｓ）　　｜　　　　　　　　　　｜　　　　　　　　　｜　　　　　　　　　｜　　　　　　　　｜　　　　　　　　　｜

｜　　　１　｜　　　　１　｜　　　　　００：００：０１　｜　　　　５．４７％　｜　　１５．１９％　｜　　２．９３３１　｜　２．４１２１　｜　　０．０１００　｜

｜　　　１　｜　　　５０　｜　　　　　００：００：０２　｜　　　８７．５０％　｜　　８７．８０％　｜　　０．４８１３　｜　０．４６６７　｜　　０．０１００　｜

｜　　　２　｜　　１００　｜　　　　　００：００：０２　｜　　　８６．７２％　｜　　８９．１８％　｜　　０．４２８９　｜　０．３９９６　｜　　０．０１００　｜

｜　　　３　｜　　１５０　｜　　　　　００：００：０３　｜　　　９１．４１％　｜　　９０．２４％　｜　　０．２８６２　｜　０．３５９６　｜　　０．０１００　｜

｜　　　３　｜　　２００　｜　　　　　００：００：０３　｜　　　９６．０９％　｜　　９０．６４％　｜　　０．１９２８　｜　０．３４６２　｜　　０．０１００　｜

｜　　　４　｜　　２５０　｜　　　　　００：００：０３　｜　　　９２．１９％　｜　　９０．８８％　｜　　０．３２２１　｜　０．３３４３　｜　　０．０１００　｜

｜　　　５　｜　　３００　｜　　　　　００：００：０４　｜　　　９６．０９％　｜　　９１．２２％　｜　　０．１５２８　｜　０．３２４９　｜　　０．０１００　｜

｜　　　５　｜　　３５０　｜　　　　　００：００：０４　｜　　　９５．３１％　｜　　９１．４２％　｜　　０．１７６２　｜　０．３２３１　｜　　０．０１００　｜

｜　　　６　｜　　４００　｜　　　　　００：００：０４　｜　　　９４．５３％　｜　　９１．４２％　｜　　０．１８８７　｜　０．３１３８　｜　　０．０１００　｜

｜　　　７　｜　　４５０　｜　　　　　００：００：０５　｜　　　９５．３１％　｜　　９１．５６％　｜　　０．１３１１　｜　０．３２２６　｜　　０．０１００　｜

｜　　　７　｜　　５００　｜　　　　　００：００：０５　｜　　　９４．５３％　｜　　９１．６０％　｜　　０．２０１０　｜　０．３１６２　｜　　０．０１００　｜

｜　　　８　｜　　５５０　｜　　　　　００：００：０６　｜　　　９７．６６％　｜　　９１．５１％　｜　　０．１０３２　｜　０．３１４９　｜　　０．０１００　｜

｜　　　９　｜　　６００　｜　　　　　００：００：０６　｜　　　９６．８８％　｜　　９１．６３％　｜　　０．１０５２　｜　０．３１５５　｜　　０．０１００　｜

｜　　　９　｜　　６５０　｜　　　　　００：００：０７　｜　　　９５．３１％　｜　　９１．４７％　｜　　０．１８１０　｜　０．３２４１　｜　　０．０１００　｜

｜　　１０　｜　　７００　｜　　　　　００：００：０７　｜　　　９５．３１％　｜　　９１．８６％　｜　　０．１７１４　｜　０．３１４５　｜　　０．０１００　｜

｜　　１１　｜　　７５０　｜　　　　　００：００：０７　｜　　　９９．２２％　｜　　９２．０１％　｜　　０．０４４９　｜　０．３１１７　｜　　０．０１００　｜

｜　　１１　｜　　８００　｜　　　　　００：００：０８　｜　　　９２．１９％　｜　　９１．８５％　｜　　０．１８９５　｜　０．３２４１　｜　　０．０１００　｜

｜　　１２　｜　　８５０　｜　　　　　００：００：０８　｜　　　９８．４４％　｜　　９２．１８％　｜　　０．０８８２　｜　０．３１３２　｜　　０．０１００　｜

｜　　１３　｜　　９００　｜　　　　　００：００：０８　｜　　　９８．４４％　｜　　９１．４２％　｜　　０．０６２５　｜　０．３３２０　｜　　０．０１００　｜

｜　　１４　｜　　９５０　｜　　　　　００：００：０９　｜　　　９８．４４％　｜　　９１．８６％　｜　　０．０６５７　｜　０．３２１９　｜　　０．０１００　｜

｜　　１４　｜　１０００　｜　　　　　００：００：０９　｜　　　９５．３１％　｜　　９１．９５％　｜　　０．１３５６　｜　０．３３５７　｜　　０．０１００　｜

｜　　１５　｜　１０５０　｜　　　　　００：００：１０　｜　　　９８．４４％　｜　　９２．１５％　｜　　０．１０６５　｜　０．３２８７　｜　　０．０１００　｜

｜　　１６　｜　１１００　｜　　　　　００：００：１０　｜　　　９９．２２％　｜　　９１．８３％　｜　　０．０３６２　｜　０．３３６４　｜　　０．０１００　｜

｜　　１６　｜　１１５０　｜　　　　　００：００：１０　｜　　　９７．６６％　｜　　９２．０２％　｜　　０．０５９５　｜　０．３３２９　｜　　０．０１００　｜

｜　　１７　｜　１２００　｜　　　　　００：００：１１　｜　　１００．００％　｜　　９１．６７％　｜　　０．０２７８　｜　０．３４１６　｜　　０．０１００　｜

｜　　１８　｜　１２５０　｜　　　　　００：００：１１　｜　　　９９．２２％　｜　　９１．８５％　｜　　０．０４４７　｜　０．３３９９　｜　　０．０１００　｜

｜　　１８　｜　１３００　｜　　　　　００：００：１２　｜　　　９７．６６％　｜　　９１．５１％　｜　　０．０７１５　｜　０．３６０３　｜　　０．０１００　｜

｜　　１９　｜　１３５０　｜　　　　　００：００：１２　｜　　　９７．６６％　｜　　９２．０１％　｜　　０．０７４８　｜　０．３４９２　｜　　０．０１００　｜

｜　　２０　｜　１４００　｜　　　　　００：００：１２　｜　　１００．００％　｜　　９２．０１％　｜　　０．０４２３　｜　０．３４８０　｜　　０．０１００　｜

｜　　２０　｜　１４５０　｜　　　　　００：００：１３　｜　　　９８．４４％　｜　　９１．９５％　｜　　０．０６１４　｜　０．３５９７　｜　　０．０１００　｜

｜　　２１　｜　１５００　｜　　　　　００：００：１３　｜　　　９８．４４％　｜　　９２．０１％　｜　　０．０２７８　｜　０．３６１０　｜　　０．０１００　｜

｜　　２２　｜　１５５０　｜　　　　　００：００：１３　｜　　１００．００％　｜　　９１．８１％　｜　　０．０２３６　｜　０．３７０７　｜　　０．０１００　｜

｜　　２２　｜　１６００　｜　　　　　００：００：１４　｜　　１００．００％　｜　　９２．０２％　｜　　０．０３０７　｜　０．３６６１　｜　　０．０１００　｜

｜　　２３　｜　１６５０　｜　　　　　００：００：１４　｜　　１００．００％　｜　　９２．１７％　｜　　０．０２１３　｜　０．３７９１　｜　　０．０１００　｜

｜　　２４　｜　１７００　｜　　　　　００：００：１４　｜　　１００．００％　｜　　９２．０４％　｜　　０．０１６３　｜　０．３７３１　｜　　０．０１００　｜

｜　　２４　｜　１７５０　｜　　　　　００：００：１５　｜　　１００．００％　｜　　９１．９４％　｜　　０．０２３０　｜　０．３７９０　｜　　０．０１００　｜

｜　　２５　｜　１８００　｜　　　　　００：００：１５　｜　　　９８．４４％　｜　　９１．９０％　｜　　０．０８４２　｜　０．３９１２　｜　　０．０１００　｜

｜　　２６　｜　１８５０　｜　　　　　００：００：１６　｜　　　９９．２２％　｜　　９２．２２％　｜　　０．０２５７　｜　０．３８１９　｜　　０．０１００　｜

｜　　２７　｜　１９００　｜　　　　　００：００：１６　｜　　１００．００％　｜　　９１．８１％　｜　　０．０１３５　｜　０．４０６９　｜　　０．０１００　｜

｜　　２７　｜　１９５０　｜　　　　　００：００：１６　｜　　１００．００％　｜　　９２．１１％　｜　　０．０１１０　｜　０．３９６９　｜　　０．０１００　｜

｜　　２８　｜　２０００　｜　　　　　００：００：１７　｜　　１００．００％　｜　　９２．０６％　｜　　０．０１３１　｜　０．３９５６　｜　　０．０１００　｜

｜　　２９　｜　２０５０　｜　　　　　００：００：１７　｜　　１００．００％　｜　　９１．７６％　｜　　０．０１８３　｜　０．４１３５　｜　　０．０１００　｜

｜　　２９　｜　２１００　｜　　　　　００：００：１７　｜　　１００．００％　｜　　９２．２２％　｜　　０．０１４６　｜　０．４０７１　｜　　０．０１００　｜

｜　　３０　｜　２１５０　｜　　　　　００：００：１８　｜　　１００．００％　｜　　９２．０１％　｜　　０．００９３　｜　０．４０９０　｜　　０．０１００　｜

｜　　３１　｜　２２００　｜　　　　　００：００：１８　｜　　１００．００％　｜　　９２．０４％　｜　　０．０１２８　｜　０．４１０５　｜　　０．０１００　｜

｜　　３１　｜　２２５０　｜　　　　　００：００：１８　｜　　　９９．２２％　｜　　９２．１０％　｜　　０．０３７０　｜　０．４１４４　｜　　０．０１００　｜

｜　　３２　｜　２３００　｜　　　　　００：００：１９　｜　　１００．００％　｜　　９１．９４％　｜　　０．０１０６　｜　０．４１７２　｜　　０．０１００　｜

｜　　３３　｜　２３５０　｜　　　　　００：００：１９　｜　　　９９．２２％　｜　　９１．９７％　｜　　０．０３６０　｜　０．４１８６　｜　　０．０１００　｜

｜　　３３　｜　２４００　｜　　　　　００：００：２０　｜　　１００．００％　｜　　９１．９５％　｜　　０．００４９　｜　０．４２５８　｜　　０．０１００　｜

｜　　３４　｜　２４５０　｜　　　　　００：００：２０　｜　　１００．００％　｜　　９２．０８％　｜　　０．０１２４　｜　０．４２０１　｜　　０．０１００　｜

｜　　３５　｜　２５００　｜　　　　　００：００：２０　｜　　１００．００％　｜　　９１．８５％　｜　　０．０１０９　｜　０．４２９７　｜　　０．０１００　｜

｜　　３５　｜　２５５０　｜　　　　　００：００：２１　｜　　　９９．２２％　｜　　９２．２２％　｜　　０．０２９８　｜　０．４２２８　｜　　０．０１００　｜

｜　　３６　｜　２６００　｜　　　　　００：００：２１　｜　　１００．００％　｜　　９１．９７％　｜　　０．００５５　｜　０．４３６４　｜　　０．０１００　｜

｜　　３７　｜　２６５０　｜　　　　　００：００：２１　｜　　１００．００％　｜　　９１．７２％　｜　　０．０１０４　｜　０．４３７９　｜　　０．０１００　｜

｜　　３７　｜　２７００　｜　　　　　００：００：２２　｜　　１００．００％　｜　　９２．０６％　｜　　０．０１５７　｜　０．４３１８　｜　　０．０１００　｜

｜　　３８　｜　２７５０　｜　　　　　００：００：２２　｜　　１００．００％　｜　　９２．０６％　｜　　０．０１０２　｜　０．４３１９　｜　　０．０１００　｜

｜　　３９　｜　２８００　｜　　　　　００：００：２２　｜　　１００．００％　｜　　９１．９７％　｜　　０．００４２　｜　０．４４７９　｜　　０．０１００　｜

｜　　４０　｜　２８５０　｜　　　　　００：００：２３　｜　　１００．００％　｜　　９１．９５％　｜　　０．００８５　｜　０．４３８９　｜　　０．０１００　｜

｜　　４０　｜　２９００　｜　　　　　００：００：２３　｜　　１００．００％　｜　　９１．８８％　｜　　０．００７６　｜　０．４４６０　｜　　０．０１００　｜

｜　　４１　｜　２９５０　｜　　　　　００：００：２４　｜　　１００．００％　｜　　９２．０８％　｜　　０．００７７　｜　０．４４４２　｜　　０．０１００　｜

｜　　４２　｜　３０００　｜　　　　　００：００：２４　｜　　１００．００％　｜　　９１．９４％　｜　　０．０１１１　｜　０．４４７２　｜　　０．０１００　｜

｜　　４２　｜　３０５０　｜　　　　　００：００：２４　｜　　　９９．２２％　｜　　９１．９５％　｜　　０．０１８９　｜　０．４４８６　｜　　０．０１００　｜

｜　　４３　｜　３１００　｜　　　　　００：００：２５　｜　　１００．００％　｜　　９１．９５％　｜　　０．００７６　｜　０．４５１３　｜　　０．０１００　｜

｜　　４４　｜　３１５０　｜　　　　　００：００：２５　｜　　１００．００％　｜　　９１．９７％　｜　　０．００２７　｜　０．４５０２　｜　　０．０１００　｜

｜　　４４　｜　３２００　｜　　　　　００：００：２５　｜　　１００．００％　｜　　９２．０２％　｜　　０．００９３　｜　０．４６０４　｜　　０．０１００　｜

｜　　４５　｜　３２５０　｜　　　　　００：００：２６　｜　　１００．００％　｜　　９１．８８％　｜　　０．００６９　｜　０．４５６１　｜　　０．０１００　｜

｜　　４６　｜　３３００　｜　　　　　００：００：２６　｜　　１００．００％　｜　　９１．９２％　｜　　０．００４３　｜　０．４５３３　｜　　０．０１００　｜

｜　　４６　｜　３３５０　｜　　　　　００：００：２６　｜　　１００．００％　｜　　９１．９２％　｜　　０．００６４　｜　０．４６７０　｜　　０．０１００　｜

｜　　４７　｜　３４００　｜　　　　　００：００：２７　｜　　１００．００％　｜　　９１．９４％　｜　　０．００７３　｜　０．４６４２　｜　　０．０１００　｜

｜　　４８　｜　３４５０　｜　　　　　００：００：２７　｜　　１００．００％　｜　　９１．９２％　｜　　０．００５０　｜　０．４６２４　｜　　０．０１００　｜

｜　　４８　｜　３５００　｜　　　　　００：００：２８　｜　　１００．００％　｜　　９２．２４％　｜　　０．００７４　｜　０．４６１８　｜　　０．０１００　｜

｜　　４９　｜　３５５０　｜　　　　　００：００：２８　｜　　　９９．２２％　｜　　９１．９７％　｜　　０．０１６７　｜　０．４７１０　｜　　０．０１００　｜

｜　　５０　｜　３６００　｜　　　　　００：００：２８　｜　　１００．００％　｜　　９１．８６％　｜　　０．００３５　｜　０．４６９２　｜　　０．０１００　｜

｜　　５０　｜　３６５０　｜　　　　　００：００：２９　｜　　１００．００％　｜　　９２．０６％　｜　　０．０１４７　｜　０．４６７７　｜　　０．０１００　｜

训练结束: 已完成最大轮数。

测试集分类准确率为92.3364%

测试集分类准确为92.0961%，效果还可以接受。如果你有兴趣，更换模型拓扑结构、优化算法、激活函数等等，可能会得到更好的分类结果。

今天分享的例子大家按照流程一步一步操作，肯定都能跑通，使用Matlab做深度学习适应于于以下人群：

1.熟悉Matlab但不熟悉Python语言的小伙伴；

2.刚刚接触深度学习，想要将理论迅速实现的小伙伴；

3.不需要state-of-art模型的，只需要将经典深度学习模型应用到自己研究领域的小伙伴

其中以上分享的Matlab中深度学习的代码，与Keras很像，都是“搭积木”的形式将模型拼凑起来而已，但是如果真的想进一步深入研究深度学习，或者是对现有模型进行改进创新，那么Matlab中提供的工具包集成度就显得太高了，pytorch或tensorflow或许更合适。但是不过怎么说，Matlab至少在深度学习领域迈出了一大步，可喜可贺。

如果对你有用，欢迎点赞，收藏，加关注，后面会持续免费更新新内容

参考：

Matlab中的深度学习——CNN图像分类实例 - 知乎 (zhihu.com)

金钥匙

Matlab中的深度学习——CNN图像分类实例

深度学习人工智能一文总结-ViT:Vision transformer的cls token如何实现分类？

学习笔记物理实验大学物理-实验篇——测量误差与数据处理（测量分类、误差、有效数字、逐差法）

发表评论取消回复

金钥匙

Matlab中的深度学习——CNN图像分类实例

深度学习 人工智能 一文总结-ViT:Vision transformer的cls token如何实现分类？

学习 笔记 物理实验 大学物理-实验篇——测量误差与数据处理（测量分类、误差、有效数字、逐差法）

相关文章

发表评论取消回复

深度学习人工智能一文总结-ViT:Vision transformer的cls token如何实现分类？

学习笔记物理实验大学物理-实验篇——测量误差与数据处理（测量分类、误差、有效数字、逐差法）