蘆♂️ 个人主页:@艾派森的个人主页 ✍作者简介:Python学习者 希望大家多多支持,我们一起进步! 如果文章对你有帮助的话, 欢迎评论 点赞 收藏 加关注+ 一、交叉验证简介 交叉验...
-
python 机器学习 决策树 数据挖掘 交叉验证之KFold和StratifiedKFold的使用(附案例实战)
-
数据挖掘 人工智能 Logistic分类
研究对象 数据集: 乳腺癌数据集 breast cancer 的原型是一组病灶造影图片,数据集提供者从每张图片中提取了30个特征,一共569个样本,其中阳性样本357,阴性样本212。 数据集特征名称、目标类别、数据集大小如...
-
数据挖掘 机器学习 Weka教程,使用Weka进行简单的分类和聚类
一、weka安装及基本操作 weka基于Java环境,所以首先需要安装Java的jdk;具体可参考JDK的下载、安装和环境配置教程(2021年,win10)_jdk下载_「已注销」的博客-CSDN博客weka软件的安装教程,...
-
人工智能 关联规则+聚类分析+分类算法(数据挖掘)
3.关联规则 经典案例 : 尿布与啤酒的故事; 基本概念 : 设I = {i1,i2,....im}是项(Item 的集合。 D 是 事务(transaction 的集合(事务数据库 。 事务T是项的集合,且对每个...
-
数据挖掘 【机器学习案例】不同的模型算法对鸢尾花数据集进行分类
前言: 经典机器学习入门项目,使用逻辑回归、线性判别分析、KNN、分类与回归树、朴素贝叶斯、向量机、随机森林、梯度提升决策树对不同占比的训练集进行分类 原文摘要: 数据源:Iris Species | Kaggle 150行...
-
人工智能 数据分析 数据挖掘 大数据 笔记 jupyter 【机器学习实训项目】黑色星期五画像分析
目录 前言 一、项目概述 1.1 项目简介 1.2 项目背景 1.3 项目目标 二、数据分析 2.1 导入库 2.2 数据基本信息 三、画像分析 3.1 画像1:消费金额Top10 3.2 画像2:高频...
-
数据挖掘 机器学习 聚类算法--DBSCAN算法
一、DBSCAN算法 简介 DBSCAN(Density-Based Spatial Clustering of Applications with Noise 是一个基于密度的聚类算法。算法把簇看作数据空间中由低密...
-
人工智能 机器学习 聚类 数据挖掘(4.1)--分类和预测
目录 前言 一、分类和预测 分类 预测 二、关于分类和预测的问题 准备分类和预测的数据 评价分类和预测方法 混淆矩阵 评估准确率 参考资料 前言 分类:离散型、分类新数据 预测:连续型、预测未知值 描述属性:连续、离散...
-
Python数据挖掘实用案例——自动售货机销售数据分析与应用
欢迎来到本文 个人简介:陈童学哦,目前学习C/C++、算法、Python、Java等方向,一个正在慢慢前行的普通人。 系列专栏:陈童学的日记 其他专栏:C++STL,感兴趣的小伙伴可以看看。 希望各位→点赞 +...
-
数据挖掘 pandas Python数据分析案例07——二手车估价(机器学习全流程,数据清洗、特征工程、模型选择、交叉验证、网格搜参、预测储存)
案例背景 本次案例来自2021年matchcop大数据竞赛A题数据集。要预测二手车的价格。训练集3万条数据,测试集5千条。官方给了二手车的很多特征,有的是已知的,有的是匿名的。要求就是做模型去预测测试集的二手车的价格。价格是...
-
网络安全 数据挖掘 笔记 安全 社交网络分析3:社交网络隐私攻击、保护的基本概念和方法 + 去匿名化技术 + 推理攻击技术 + k-匿名 + 基于聚类的隐私保护算法
社交网络分析3:社交网络隐私攻击、保护的基本概念和方法 + 去匿名化技术 + 推理攻击技术 + k-匿名 + 基于聚类的隐私保护算法 写在最前面社交网络隐私泄露用户数据暴露的途径复杂行为的隐私风险技术发展带来的隐私挑战经济...
-
数据挖掘 R语言实现常用的5种分析方法(主成分+因子+多维标度+判别+聚类
R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐...
-
数据挖掘 多视图聚类的论文阅读(一)
当聚类的方式使用的是某一类预定义好的相似性度量时, 会出现如下情况: 数据聚类方面取得了成功,但它们通常依赖于预定义的相似性度量,而这些度量受原始方法的影响:当输入维数相对较高时,往往是无效的。 Applied Intell...
-
数据挖掘 机器学习 算法 卡方检验:案例实战
卡方检验(Chi-square test)是一种常用的统计方法,用于研究观察数据与期望数据之间的偏差程度。卡方检验适用于分类变量的统计分析,例如比较两组样本在不同因素下的分布情况、检验观察频数与理论频数是否存在显著差异等。...
-
数据挖掘 数据分析 归因分析计算因子贡献度常见的方法
在归因分析中,我们一般都需要计算出每个因子的贡献度是多少,比如产品DAU上升,对年龄段维度进行拆解,看是不同年龄段的用户对DAU上升的贡献度是多少,一般根据指标的类型,计算贡献度的方法也不一样,下面就列出一些常见的归因分析贡...
-
【数据挖掘】期末复习(样卷题目+少量知识点)
目录 第一章 绪论1、填空题(1)从技术层面上看,数据挖掘是( )。从商业层面看,数据挖掘是( )。(2)数据挖掘所得到的信息具有( )、有效和实用三个特征。 2、数据挖掘在生活场景中的应用3、区分数据挖掘和查询...
-
gpt 数据挖掘 python power BI 数据可视化 大数据 【文末送书】AIGC时代的数据分析与可视化
欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关...
-
人工智能 数据挖掘 数据分析 r语言 在Excel表格中如何使用分类汇总
在Excel表格中如何使用分类汇总 目录 在Excel表格中如何使用分类汇总 1、例如:按照销售人分类汇总 2、首先对销售人B列排序,依次点击【开始】【排序】【自定义排序】,在主要关键词中下拉选择【销售人】,再点击确定,排序...
-
数据挖掘 【完整思路】2023 年中国高校大数据挑战赛 赛题 B DNA 存储中的序列聚类与比对
2023 年中国高校大数据挑战赛 赛题 B DNA 存储中的序列聚类与比对 任务 1.错误率和拷贝数分析:分析“train_reads.txt”和“train_reference.txt”数据集中的错误率(插入、删除、替换、...
-
人工智能 数据挖掘 大数据 AI写作文案的技巧:Wordhero AI写作SOP
文案引用自AI Content Hacker Tips 7步成文:2000+单词SEO文案写作 | Wordhero AI Editor大更新 心态:用AI写作的正确态度 人工智能 (AI 的兴起导致写作世界发生了一些有...
-
机器学习与数据挖掘——分类与预测模型
如果有兴趣了解更多相关内容,欢迎来我的个人网站看看:瞳孔空间 一:分类与预测 分类(Classification :分类是找出描述并区分数据类或概念的分类函数或分类模型(也常常称作分类器 ,该模型能把数据库中的数据项映射到给...
-
人工智能 时空数据挖掘精选23篇论文解析【AAAI 2023】
今天和大家分享时空数据挖掘方向的资料。 时空数据挖掘是人工智能技术的重要分支,是一种采用人工智能和大数据技术对城市时空数据进行分析与挖掘的方法,旨在挖掘时空数据,理解城市本质,解决城市问题。 目前,时空数据挖掘广泛应用于交通...
-
产品运营 数据挖掘 常见的5种数据分析方法有哪些?
看大家介绍了那么那么多的数据分析方法,但不同的数据分析方法使用场景不同,A常用的B不一定常用。 所以这篇只介绍5种基于逻辑层面的,几乎人人都会用的数据分析方法。 先来分享一下数据分析6大步骤: 按照这6个步骤,结合相关数据进...
-
机器学习 数据挖掘 c语言 开发语言 ChatGPT4和python完美融合,快速完成数据分析与可视化、人工智能建模及论文高效撰写
2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、...
-
服务器 数据挖掘 「玩转 TableAgent 数据智能分析」实战数据分析演练
文章目录 前言TableAgent 功能亮点人人都是数据分析师融合创新应用的新成果 TableAgent 使用介绍登陆功能介绍申请认证 实战数据集分析一导入 CSV 文件数据发起提问TableAgent 应答结...
-
sklearn 【数据挖掘】基于粒子群算法优化支持向量机PSO-SVM对葡萄酒数据集进行分类
1.粒子群算法的概念 PSO是粒子群优化算法(Particle Swarm Optimization)的英文缩写,是一种基于种群的随机优化技术,由Eberhart和Kennedy于1995年提出。粒子群算法是模仿昆虫、兽群、...
-
kmeans 数据挖掘 机器学习 python 实现k-means聚类算法 银行客户分组画像实战(超详细,附源码)
想要数据集请点赞关注收藏后评论区留言留下QQ邮箱 k-means具体是什么这里就不再赘述,详情可以参见我这篇博客 问题描述:银行对客户信息进行采集,获得了200位客户的数据,客户特征包括以下四个1:社保号码 2:姓名 3:...
-
人工智能 数据挖掘 机器学习 【强化学习】——Q-learning算法为例入门Pytorch强化学习
蘆♂️ 个人主页:@Lingxw_w的个人主页 ✍作者简介:计算机研究生在读,研究方向复杂网络和数据挖掘,阿里云专家博主,华为云云享专家,CSDN专家博主、人工智能领域优质创作者,安徽省优秀毕业生 希望大家多多支持...
-
数据挖掘 2021泰迪杯数据分析技能赛A题:Python实现通讯产品销售和盈利能力分析(含原始数据)
这周复习了python数据处理的实战,把之前竞赛的题目重新做了一遍。这里侧重数据分析与数据处理的部分。文末含原始题目与数据,需要的小伙伴自取~ 【事先说明】:本文只是在技术维度上进行分析及展示,在业务维度上没有做过多分析。事...
-
人工智能 数据挖掘 京东大数据平台(京东数据分析):9月京东牛奶乳品排行榜
鲸参谋监测的京东平台9月份牛奶乳品市场销售数据已出炉! 9月份,牛奶乳品市场销售呈大幅上涨。鲸参谋数据显示,今年9月,京东平台牛奶乳品市场的销量为2000万+,环比增长约65%,同比增长约3%;销售额为23亿+,环比增长约1...
-
python 数据挖掘 tyut数据分析考试资料
1、关于数据分析的说法,下列描述错误的是()。C A.数据分析可以通过计算机工具和数学知识处理数据| B.可以做出具有针对性的决策| C.数据分析没有实际的使用意义| D.在大数据环境下,数据分析能够挖掘出更有价值的信息 2...
-
数据挖掘 大数据 big data 100天精通Python(数据分析篇)——第48天:数据分析入门知识
文章目录 1. 为什么要学数据分析?2. 数据分析的概念3. 数据分析涉及哪些能力4. 数据分析的流程5. Python做数据分析学什么? 1. 为什么要学数据分析? 近两年来,数据分析师的岗位需求非常大,90%的岗位技能...
-
人工智能 数据挖掘 机器学习强基计划8-1:图解主成分分析PCA算法(附Python实现)
目录 0 写在前面 1 为什么要降维? 2 主成分分析原理 3 PCA与SVD的联系 4 Python实现0 写在前面 机器学习强基计划聚焦深度和广度,加深对机器学习模型的理解与应用。“深”在详细推导算法模型背后...
-
大数据的常用算法(分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘)
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计...
-
数据分析 数据挖掘 gpt-3 AI作画 万兴科技WondershareFilmora焕新上线已率先接入ChatGPT母公司OpenAI相关服务
AIGC加速布局!近日,创意软件A股上市公司万兴科技(300624.SZ)旗下视频创意软件Wondershare Filmora焕新上线,新版本全新接入ChatGPT母公司OpenAI相关服务,率先在视频创作领域集成AIGC...
-
数据挖掘 统计聚类法的基本步骤:
统计聚类法的基本步骤: 1˃形成数据框 2˃计算距离阵 计算n个样品两两间的距离D。 3˃进行系统聚类 (I)构造n个类,每个类只包含一个样品; (2)合并距离最近的两类为一新类; (3)计算新类与当前各类的距离,若类个数为...
-
python 数据分析 k-means 数据挖掘 电商用户价值分析——基于RFM模型、KMeans聚类
电商用户价值分析——基于RFM模型、KMeans聚类 一、背景二、RFM模型、KMeans聚类三、分析框架四、具体分析1. 导入所需的库2. 导入数据3. 数据清洗4. 数据分析4.1 核心数据分析4.2 用户分析...
-
机器学习 算法 数据挖掘 python 密度聚类(CFDP)原理与实现
密度聚类,也被称为CFDP(Clustering by fast search and find of density peaksd 。 密度聚类的作用和Kmeans聚类差不多,可以将一堆数据分成若干类。“密度聚类”...
-
期末考试 数据挖掘知识点整理(期末复习版)
目录 ==第一章 绪论==数据挖掘产生的背景?驱动力是什么?大数据的特点是什么?什么是数据挖掘?数据挖掘一般流程是什么?业界数据整合&分析的过程是怎样的?举例数据挖掘在各个领域的应用数据挖掘的四大主要任务?他们的区别是什么...
-
聚类 数据挖掘 Apriori算法的应用(python)
文章目录 前言一、实验步骤以及实现二、调试过程总结 前言 实验内容: 了解Apriori算法的实现过程以及应用原理,最后用Python实现Apriori聚类算法。 一、实验步骤以及实现 1.构造原始数据,通过def实现。...
-
数据挖掘 人工智能 分类模型评估指标——准确率、精准率、召回率、F1、ROC曲线、AUC曲线
机器学习模型需要有量化的评估指标来评估哪些模型的效果更好。 本文将用通俗易懂的方式讲解分类问题的混淆矩阵和各种评估指标的计算公式。将要给大家介绍的评估指标有:准确率、精准率、召回率、F1、ROC曲线、AUC曲线。 机器学习...
-
信息可视化 数据分析 数据挖掘 seaborn绘制热力图,如何取消热力图之间的网格线
前言 最近基于python绘制热力图,在此总结一下自己学到的新知识 。 heatmap()中参数属性解释 vmin,vmax:用于指定右侧bar中最小值与最大值的显示值cmap:指定一个colormap对象,用于热力图的填充...
-
数据挖掘 基于聚类算法完成航空客户价值分析任务
1、背景与挖掘目标 1.1 案例背景 著名的“二八”定律 二八定律:20%的客户,为企业带来约80%的利益。在企业与客户关系管理中,对客户分类,区分不同价值的客户。针对不同价值的客户提供个性化服务方案,采取不同的营销策略,将...
-
数据挖掘 2023 年中国高校大数据挑战赛赛题B DNA 存储中的序列聚类与比对-解析与参考代码
题目背景:目前往往需要对测序后的序列进行聚类与比对。其中聚类指的是将测序序列聚类以判断原始序列有多少条,聚类后相同类的序列定义为一个簇。比对则是指在聚类基础上对一个簇内的序列进行比对进而输出一条最有 可能的正确序列。通过聚类...
-
数据分析 数据挖掘 小提琴图如何分析?
在数据分布展示时,可使用箱线图和小提琴图,相对箱线图,小提琴图可展示出数据分布的轮廓情况,关于SPSSAU中箱线图和小提琴图的说明分别如下: 分析来源于SPSSAU 分析来源于SPSSAU 箱线图时,其目的更多在于查看数据的...
-
数据挖掘 自动驾驶 边缘计算 聚类 离群度量算法
算法介绍 箱线图(Interquartile Range,IQR) 箱线图,又称为盒须图,是一种常用的数据可视化方法,用于显示数据集的统计分布情况。箱线图的构成包括最大值、最小值、中位数、上四分位数(Q3)和下四分位数(Q1...
-
python 数据挖掘 开发语言 数据库 Pandas告警UserWarning: pandas only supports SQLAlchemy connectable
Pandas告警UserWarning: pandas only supports SQLAlchemy connectable 一、报错信息二、老的书写方式三、新的书写方式 一、报错信息 使用老的书写方式从数据库导入数据...
-
机器学习 数据挖掘 手写分类决策树(鸢尾花数据集)
目录 1.实验简介及数据集2.算法分析3.具体实现3.1 数据结构3.2 如何产生分支3.2.1 增益3.2.2 寻找某一属性的阈值3.2.3 寻找最优属性及其阈值 3.3 建立决策树3.4 预测3.5 整体代码...
-
聚类 数据挖掘 机器学习 Cluster analysis :Basic Concepts and Algorithms -- Part 1 Overview
参考文献:(1 《Introduction to Data Mining (Second Edition 》,2018,Tan, Pang-Ning;Steinbach, Michael;Karpatne, Anuj;Kum...
-
数据挖掘 机器学习——聚类——商场客户聚类
聚类的介绍 案例——商场客户聚类 目录 聚类的介绍 案例——商场客户聚类 一、读取数据 二、聚类 KMeans函数的参数讲解: KMeans属性列表 KMeans接口列表 三、查看数据及可视化 sort_values()方...