简述K均值算法的基本步骤,及k的选取         1.从样本中选取k个对象作为初始聚类中心         2.将剩余样本点按照邻近原则划分到最近的聚类中去         3.使用每个聚类的样本均值更新聚类中心         4.重复2,3过程,直到聚类中心不再发生变化         5.输出最终的聚类中心和k个簇的划分

 

什么是模式识别,有什么意义?         模式识别是指对表征事物和现象的各种样式的(数值,文本,逻辑关系等)信息进行处理分析,以对事物和现象进行描述、分类、辨认和解释的过程,是信息科学与人工智能的重要组成部分

        研究的意义在于研究人脑的模式识别过程的能力有助于提升计算机的能力,反之,研究机器的模式识别过程的能力也有助于理解人脑的过程

 

模式识别的预处理是什么?         预处理是以消去噪声和加强有用的信息为目的,并对输入测量仪器等因素所造成的退化现象进行复原的过程

 

简述SVM的基本思想         SVM是一个二分类模型,它通过寻找一个超平面来对样本进行分类,分类的原理是间隔最大化,最终转化为一个求凸二次规划的问题,由简至繁的模型有:         当样本线性可分时,通过硬间隔最大化,来学习一个线性可分的SVM         当样本近似线性可分时,通过软间隔最大化,来学习一个线性可分的SVM         当样本线性不可分时,通过核函数与软间隔最大化,来学习一个非线性的SVM

 

神经网络在训练时能否将所有的参数都初始化为0?         不能,如果全初始化为0,神经元最后的输出都会是一样的,那么在反向传播计算当中,梯度的变化一样,参数更新值一样,无论有多少个隐藏层,最后的输出结果都是一样的,但我们希望不同的神经元有不同的输出,那样的神经网络才是有意义的

 

Sigmoid函数作为激活函数有什么缺点?         1.容易出现梯度消失的情况         2.sigmoid函数的输出是非0均值的         3.幂运算相对耗时

 

简述K近邻算法的基本思想         K近邻算法是一个基于实例的分类方法,它通过寻找与未知样本x相邻最近的k个训练对象,看这k个对象大部分属于哪一类,就把x归于那一类中。K近邻算法是一种懒惰的学习方法,它存储数据,只在需要分类的时候才进行分类,当样本很复杂时,计算消耗可能会很大,因此,它不适用于实时性很强的场合中

2010年后,使得深度神经网络得以快速应用的技术突破有哪些?举4个例子         GPU的发展,Dropout正则化技术的应用,Relu函数的兴起,通过重建误差进行预训练,通过变形已有样本来生成更多的训练样本

        应用:DeepMind团队开发出了一个应用于游戏领域的通用人工智能算法;开发出了AlphaGo,在博弈领域取得突破;次年开发出AlphaGo的升级版,再次取得突破;谷歌团队的机器翻译技术取得重大突破

 

简述隐马尔可夫模型的三个基本问题         1.评估问题:即概率计算问题,给定模型和观测序列,求观测序列在该模型出现的概率         2.学习问题:即参数估计问题,给定观测序列,去估计模型中的参数,使得观测序列在该模型中出现的概率最大         3.预测问题:给定模型和观测序列,求观测序列最可能对应的状态序列

精彩内容

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: