目录 一、前言二、初阶画图2.1 基本条形图2.2 水平柱状图2.3 带图例的堆叠柱状图2.4 带图例的分组柱状图2.5 用ggplot2作图2.6 用plotly作图 三、进阶画图3.1 水平柱状图3.2 显著性柱状...
-
开发语言 数据挖掘 【R语言】24种R语言作图新手入门之barplot柱状图(一)
-
数据仓库 数据挖掘 大数据 怎样理解维度建模?
维度建模(dimensional modeling)是数据仓库建设中的一种非常重要的数据建模方法,是将数据进行结构化的逻辑设计方法。 维度建模由数据仓库领域的大师Ralph Kimball最先提出,他所参与著作的《数据仓库...
-
大数据 数据挖掘 三创数据分析题库及个人作答
文章目录 数据分析概述数据采集数据预处理数据分析方法数据可视化 官方未给出答案,一切答案均为个人作答。有错指出,会及时修改。 如违反规则请联系,立马删除。 只有选择题,部分解析 数据分析概述 1、 下列描述错误的是(...
-
python pandas 机器学习 数据挖掘 数据分析 2023年美国大学生数学建模C题:预测Wordle结果建模详解+模型代码(一)
目录 前言 一、题目理解 背景 解析 字段含义: 建模要求 二、建模思路 灰色预测: 编辑 二次指数平滑法: person相关性 只希望各位以后遇到建模比赛可以艾特认识一下我,我可以提供免费的思路和部分源码,以后的数模...
-
人工智能 大数据 数据挖掘 工程经济留档
布局情况 他想以什么方式 什么竞争力 去服务一个什么群体,布局其实就是他目前在什么领域做什么服务 主要目标:教,学,考,评,管 整体竞争力:“人工智能助力教育,因材施教成就梦想”——通过大数据统计实现智慧教育。 群体(三大块...
-
数据仓库 数据库 数据挖掘 数据治理中最常听到的名词有哪些?
开门见山,我们先来说说何为“数据治理” 数据治理就是实现数据价值的过程。通俗的理解就是让企业的数据从不可控、不可用、不好用到可控、方便易用且对业务有极大帮助的过程。 这个过程怎么实现?通过采集、传输、储存等一系列标准化流程将...
-
数据挖掘 【愚公系列】软考中级-软件设计师 018-数据结构(二叉树的分类)
作者简介,愚公搬代码 《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,5...
-
开发语言 数据分析 数据挖掘 r语言 Excel工作表中设置好公式的单元格内容,不允许修改,如何锁定?
Excel工作表中设置好公式的单元格内容,不允许修改,如何锁定? 目录 Excel工作表中设置好公式的单元格内容,不允许修改,如何锁定? 1、例如:我们做表格时已经设置好公式,只允许填写数据,不允许修改内容,下图中的填写日期...
-
数据仓库 数据库 数据挖掘 【湖仓一体化】存OR算之争?SPL 我都要
在互联网技术飞速发展的今天,数据已经成为了最为宝贵的资源之一。数据的产生、收集和分析,已经成为了科技公司最为重要的一环。到底什么是湖仓一体?它和数据仓库、数据湖的关系是什么?为什么要用一体来形容呢? 从一体机、超融合到云计算...
-
人工智能 数据挖掘 计算机视觉 10种基于MATLAB的方程组求解方法
线性方程组的求解包括直接法和迭代法,其中迭代法包括传统的高斯消元法,最速下降法,牛顿法,雅克比迭代法,共轭梯度法,以及智能启发式算法求解法和神经网络学习算法,传统算法可以相互组合改进,智能仿生启发式算法包...
-
数据挖掘 数据科学 《PySpark大数据分析实战》-18.什么是数据分析
博主简介 作者简介:大家好,我是wux_labs。 热衷于各种主流技术,热爱数据科学、机器学习、云计算、人工智能。 通过了TiDB数据库专员(PCTA)、TiDB数据库专家(PCTP)、TiDB数据库认证SQL开...
-
python 数据挖掘 算法 2023五一杯C题“双碳”研究详细思路及代码
C题:“双碳”目标下低碳建筑研究 “双碳”即碳达峰与碳中和的简称,我国力争2030年前实现碳达峰,2060年前实现碳中和。“双碳”战略倡导绿色、环保、低碳的生活方式。我国加快降低碳排放步伐,大力推进绿色低碳科技创新,以提高产...
-
大数据 人工智能 数据挖掘 开发语言 python 数据工程师需要具备哪些技能?
成为数据工程师需要具备哪些技能?数据工程工作存在于各个行业,在银行业、医疗保健业、大型科技企业、初创企业和其他行业找到工作机会。许多职位描述要求数据工程师、拥有数学或工程学位,但如果有合适的经验学位往往没那么重要。 大数据开...
-
【机器学习/数据挖掘】第二章数据
认识数据 数据挖掘之前的基础知识(了解一些基础术语 2.1数据对象与属性类型 数据对象(又叫样本,实例,数据点或对象 :代表一个实体,如销售数据库中,可以是顾客,商品.→就是数据库的行 数据集:由数据对象组成→表 2.1....
-
数据挖掘 算法 集成学习01
本章分以下几块来讲解 一.xgboost 模型参数介绍 二.xgboost 两种方式实现 三. 网格搜索最优xgboost参数 一.XGBoost的参数 XGBoost的作者把所有的参数分成了三类,这里只介绍我们常用的一些参...
-
安全 数据挖掘 深度学习 推荐算法 人工智能 Black-Box Attacks on Sequential Recommenders via Data-Free ModelExtraction
摘要 我们研究了模型提取是否可以用来“窃取”顺序推荐系统的权值,以及对此类攻击的受害者构成的潜在威胁。这种风险在图像和文本分类中引起了关注,但据我们所知,在推荐系统中却没有。我们认为,序列推荐系统由于特定的自回归机制,受到独...
-
人工智能 机器学习 数据分析 python 图数据挖掘!使用图分析+AI进行保险欺诈检测
作者:韩信子@ShowMeAI 机器学习实战系列:https://www.showmeai.tech/tutorials/41 本文地址:https://www.showmeai.tech/article-det...
-
计量经济学 统计分析 数据分析 数据挖掘 stata回归结果输出中,R方和F值到底是用来干嘛的?
先直接回答问题,R方表示可决系数,反映模型的拟合优度,也就是模型的解释能力如何,也可以理解为模型中的各个解释变量联合起来能够在多大程度上解释被解释变量;F值用于模型整体的统计显著性,对应的P值越小,比如在0.05以下,则说明...
-
数据挖掘 算法 超全面,盘点14 种数据异常值检验方法
本文收集整理了公开网络上一些常见的异常检测方法(附资料来源和代码)。不足之处,还望批评指正。 一、基于分布的方法 基于正态分布,3sigma准则认为超过3sigma的数据为异常点。 图1: 3sigma 技术交流 技术要学...
-
数据挖掘 神经网络 人工智能畅想——《人工智能简史》读后感
1. 引言 我今天要分享的是尼克著的《人工智能简史》。目前我看的是第一版,它主要讲述了有关于人工智能的起源、发展中的趣事,也提及了一些对于人工智能的思考。第一版比较早了,是2017年的时候出版的,2021年的时候出了第二版。...
-
信息可视化 数据分析 数据挖掘 初识Tableau—(保姆级教程)
❤前言我想吟诗一首:开个新专栏,一点也不难,Tableau学完,收获感满满!❤ 这篇我们主要来聊一下数据可视化常用软件——Tableau的介绍,在学习Tableau之前我们要知道数据可视化究竟是什么,它的发展历史到底是怎...
-
数据挖掘 数据分析 基础的数据清洗操作——jupyter
基于jupyter的基础数据清洗操作,内容涵盖重复值查找与删除、数值替换、过滤缺失值、填充缺失值 重复值查找与删除 data.duplicated( #请注意哪个值被认为是重复的 第一次出现被认为不是重复,第二次出现才认...
-
开发语言 数据挖掘 人工智能 R语言Lasso回归模型变量选择和糖尿病发展预测模型
全文链接:http://tecdat.cn/?p=22721 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择(点击文末“阅读原...
-
机器学习 数据挖掘 统计学习方法---李航
统计学习方法笔记 第一章:统计学习概论 1.1 统计学习 统计学习( statistical learning 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习也称为统计机器学习(sta...
-
数据分析 数据挖掘 python中Polars库详解
python中的Polars库 什么是polars Polars 是一个用于数据处理的 Python 库,提供了类似于 Pandas 的 API,但却更加快速和内存高效。 Polars 能够处理非常大的数据集,并在运行时对其...
-
python 机器学习 2023年“呕心沥血”之泰迪杯数据挖掘A题新冠疫情比赛经历分享
个人名片: 作者简介:一名大二在校生,热爱生活,爱好敲码! \ 个人主页 磊:holy-wangle ➡系列内容: ️ tkinter前端窗口界面创建与优化 ️ Java实现ATP小系统 ✨个性签名: 不积跬步,无...
-
概率论 数据挖掘 机器学习 数据分析 经验分享 DEseq2 差异分析基本原理
DEseq简介 寻找组间显著表达变化的基因,以解释基因表达水平的变化对生物功能的变化最直接的办法就行进行转录组测序和定量。那如何从不同组定量的转录组寻找到那些显著差异的基因呢?DESeq 就是来解决这个问题的,它主要使用负二...
-
数据挖掘 人工智能 使用预训练resnet18实现CIFAR-10分类
基于ResNet18网络完成图像分类任务 图像分类(Image Classification)是计算机视觉中的一个基础任务,将图像的语义将不同图像划分到不同类别。很多任务也可以转换为图像分类任务。比如人脸检测就是判断一个区域...
-
数据挖掘 人工智能 七、一百零二类花分类项目实战
一、准备数据集 一百零二类花数据集下载 flower_data包括train和valid文件,分别存放102个文件,对应102种类别的花 cat_to_name.json为类别和花品种键值对 将压缩包进行解压,跟项目放...
-
r语言 数据挖掘 人工智能 机器学习 人群归因分数(2):多分类变量、控制变量
专注系列化、高质量的R语言教程 推文索引 | 联系小编 | 付费合集 本文接上篇继续介绍人群归因分数(PAF)的计算,主要介绍风险因子是多分类变量、含控制变量两种情况。 本篇目录如下: 1 多分类变量2 含控制变量...
-
python 数据分析 数据挖掘 Jupyter Notebook总是未显示Nbextensions的标签
下载插件 下载插件 进行相关文件的安装 重启jupyter 如图所示,正常情况下会显示Nbextensions的标签 未显示Nbextensions的标签解决方法 在启动jupyter的终端,查看是否报404 缺少...
-
数据挖掘 机器学习 人工智能 语音识别 白话聊技术系列(1)| 情感分析
情感分析又称意见挖掘,是指对带有情感主观色彩的文本进行分析,挖掘出其中蕴含的情感倾向、态度和看法的过程,越来越成为自然语言处理和文本分类技术的研究热点。 一、背景介绍 社交媒体如微博、抖音、知乎等每天都在产生大量的人们对于事...
-
数据挖掘 人工智能 Logistic 回归算法
Logistic 回归 Logistic 回归算法Logistic 回归简述Sigmoid 函数Logistic 回归模型表达式求解参数 θ梯度上升优化算法 Logistic 回归简单实现使用 skl...
-
数据挖掘 【BES-BP分类】基于秃鹰搜索算法优化BP神经网络数据分类预测附Matla实现
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进, 代码获取、论文复现及科研仿真合作可私信。 个人主页:Matlab科研工作室 个人信条:格物致知。 更多Matlab完整代码及仿真定制内容点击...
-
数据库 python 开发语言 数据分析 通俗易懂,数据挖掘的过程是什么?
导读:数据挖掘过程包含数据清洗、特征提取、算法设计等多个阶段,本文将讨论这些阶段。 01 数据挖掘过程 典型数据挖掘应用的过程包含以下几个阶段。 1. 数据采集 数据采集工作可能是使用像传感器网络这样的专门硬件、手工录入的用...
-
人工智能 数据挖掘 智慧校园大数据云平台(2)
大数据教学创新应用 教学质量评估 对学生给予教师的评价、学生活跃程度、学生成绩和教师授课情况等数据进行分析研究,帮助教师更好地进行教学活动。 上网行为 对各年级同学上线次数、上网时间段、总流量以及...
-
人工智能 node.js 笔记 课程设计 javascript 数据挖掘课设
目录 实验一 Apriori算法设计与应用 实验二 Close算法设计与应用 实验三 FP-tree算法设计与应用 实验四 EM算法设计与应用 实验五 KNN算法设计与应用 实验六 ID3算法设计与实现 实验七 DBSCA...
-
数据挖掘 机器学习 人工智能 2.Python数据分析项目——旅游景点票价预测
1.总结 流程具体操作基本查看查看缺失值、查看数值类型预处理缺失值处理(填充)拆分数据(获取有需要的值) 、统一数据格式数据分析groupby分组求最值数据、seaborn可视化预测(RandomForestRegresso...
-
开发语言 数据挖掘 Python电影观众数量回归分析 随机森林 可视化 实验报告
实验代码:Python电影观众数量回归分析随机森林可视化-数据挖掘文档类资源-CSDN文库 前言 随着经济的发展和人民日益增长的美好生活需要的显著提升,看电影成为了人民群众在闲暇时光娱乐的重要途径。面对百花齐放的电影产业,哪...
-
数据挖掘 统计分析 正态性检验 【练习赛】2022年高教杯数学建模C题(第一题的第二小问)
题目: 结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律。 分析: 分别讨论铅钡玻璃与高钾玻璃风化前后的变化差异进行描述性统计分析、散点图统计分析、正态分布检验等,总结变化情况。 1. 散点图统计分析: 我们先...
-
数据挖掘 使用Python进行数据分析——描述性统计分析
大家好,描述性统计分析主要是指求一组数据的平均值、中位数、众数、极差、方差和标准差等指标,通过这些指标来发现这组数据的分布状态、数字特征等内在规律。在Python中进行描述性统计分析,可以借助Numpy、Pandas、Sci...
-
数据挖掘 人工智能 排序算法 链表 机器学习 1.倒排索引 && 2.逻辑斯提回归算法
1.倒排索引 倒排索引(Inverted Index)是一种数据结构,用于快速查找包含某个特定词或词语的文档。它主要用于全文搜索引擎等应用,允许用户根据关键词迅速定位相关文档。 倒排索引的基本思想是反转(倒排)文档-词语的映...
-
数据挖掘 Python 改进YOLOv5:新的MPDIoU损失函数实现准确有效的边界框回归
改进YOLOv5:新的MPDIoU损失函数实现准确有效的边界框回归 YOLOv5是一种广泛应用于目标检测任务的深度学习模型,它具有高效和准确的特点。然而,为了进一步提升其性能,研究人员最近提出了一种改进的损失函数——MPDI...
-
笔记 学习 《数据仓库与数据挖掘》期末复习总结
《数据仓库与数据挖掘》期末复习总结 适用教材:《数据挖掘概念与技术(第3版)》,Jiawei Han,Mieheline Kamber,Jian Pei著,机械工业出版社 提示:与教材内容不完全匹配,有所取舍 写在前面: 这...
-
数据挖掘 数学建模学习:岭回归和lasso回归
线性回归 在多元线性回归模型中,估计回归系数使用的是OLS,并在最后讨论异方差和多重共线性对模型的影响。事实上,回归中自变量的选择大有门道,变量过多可能会导致多重共线性问题导致回归系数不显著,甚至造成OLS估计失效。 岭回归...
-
数据挖掘 简单线性回归和多项式回归
所用数据集women提供了15个年龄在30~39岁间女性的身高和体重信息,想通过身高预测体重。 简单线性回归 结果数据分析: 回归系数(3.45)显著不为0(p 残差标准误(1.525lbs)则可认为是模型用身高预测体重的...
-
数据仓库 数据挖掘 数据库 数据湖 【舍友居然在看】知网都搜不到的知识:湖仓一体
写在前面 博客主页:kikoking的江湖背景欢迎关注点赞收藏⭐️留言本文由 kikokingzz 原创,CSDN首发!首发时间:2021年1月19日最新更新时间:2021年1月19日✉️坚持和...
-
数据挖掘 数据分析 R语言数据标准化
在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间, 其中最典型的就是数据的归一...
-
机器学习 聚类 数据挖掘 分类 人工智能 UCI数据集下载及转换为arff文件
UCI官网:UCI Machine Learning Repository 1,进入官网后点击右上角的View ALL Data Sets,查看所有的数据集,如下图所示: 2,进入Data Sets界面后,可以在...
-
数据挖掘 计算机视觉 深度学习 python kaggle竞赛-宠物受欢迎程度(赛题讲解与数据分析)
比赛官网地址 赛题介绍 petfinder是马来西亚领先的动物福利平台宠物网站地址 该网站使用可爱指数来排名宠物照片。它分析了图片组成和其他因素,并与数千个宠物档案的表现进行了比较。 在这场比赛中,你将分析原始图像和元数据...