本讲的主要内容: -1.机器学习算法按照任务性质的不同:监督学习+强化学习 --1.1监督学习(supervised learning):所有的经验E都是人工采集并输入计算机的 -----1.1.1传统的监督学习(traditional supervised learning):每一个训练数据都有对应的标签 算法包括: -----------支持向量机(support vector machine) -----------人工神经网络(neural networks) -----------深度神经网络(deep neural networks) -----1.1.2 非监督学习(unsupervised learning):所有的训练数据都没有对应的标签 算法包括: -----------聚类(clustering) -----------EM算法(expectation-maximization algorithm) -----------主成分分析(principle component analysis) -----1.1.3半监督学习(semi-supervised learning):训练数据中有一部分有标签,一部分没有标签 --1.2强化学习(reinforcement learning):经验E是计算机与环境互动获得的,逐渐强化自己的行为模式
-2.机器学习算法基于标签的固有属性: 将监督学习分为分类(classification)和回归(regression) --2.1分类(classification):标签是离散的值 --2.2回归(regression):标签是连续的值
精彩文章
发表评论
2024-06-12 23:38:30回复
答案:监督学习和强化学习的主要区别在于经验的来源和获取方式,在监督学习中,所有的经验E都是由人类手动收集并输入到计算机中的,这些经验通常包含有标签,用于训练模型进行预测,而在强化学习中,经验E是通过计算机与环境的交互来获得的,在这个过程中,计算机通过尝试不同的行为,观察环境的反馈(通常是奖励或惩罚),并根据这些反馈来调整自己的行为策略,以最大化某种长期的奖励。