Hive - 金钥匙

网站首页 > Hive

智能造物者笔记 2024-07-24 Hive hadoop 数据仓库

hadoop 数据仓库 hive 列转行—collect

文章目录一、collect_set( /collect_list( :二、实际运用1、创建测试表及插入数据 :举例1：按照id，cur_day分组，取出每个id对应的所有rule（不去重）。举例2：按照id，cur_day分...

数据库

6查看

0评论
游戏编程异次元 2024-07-19 hadoop Hive apache

SQL报错信息: org.apache.hadoop.hive.ql.parse.ParseException:line 9:6 cannot recognize input near ‘＜EOF＞‘

1. 当前使用hive版本:3.1.32.报错信息:org.apache.hadoop.hive.ql.parse.ParseException:line 9:6 cannot recognize input near ''...

数据库

2查看

1评论
IT技能加油站 2024-07-15 Hive sql

HIVE SQL实现分组字符串拼接concat

在Mysql中可以通过group_concat( 函数实现分组字符串拼接，在HIVE SQL中可以使用concat_ws( +collect_set( /collect_list( 函数实现相同的效果。实例：1.conca...

数据库

5查看

0评论
欢乐IT学习小屋 2024-07-15 apache flink Hive

使用 Apache Flink 从 Hive 批量加载数据到 HBase

使用 Apache Flink 从 Hive 批量加载数据到 HBase在大数据处理和存储中，Hadoop 生态系统提供了丰富的工具来实现高效的数据处理和管理。本篇博客将介绍如何使用 Apache Flink 将 Hive...

数据库

7查看

1评论
编程思维与实战技巧宝典 2024-07-11 spark Hive 大数据

hive 大数据采用yarn方式启动spark-thriftserver

采用yarn方式启动spark-thriftserver 1、修改spark-env.sh配置文件2、修改spark-defaults.conf配置文件3、启动thriftserver4、查看是否启动 5、采用beeli...

数据库

3查看

1评论
未来能源科技展望 2024-07-11 Hive 数据仓库 hadoop

hadoop hive数据仓库搭建

一、虚拟机安装CentOS7并配置共享文件夹二、CentOS 7 上hadoop伪分布式搭建全流程完整教程三、本机使用python操作hdfs搭建及常见问题四、mapreduce搭建五、mapper-reducer编...

数据库

3查看

1评论
代码梦想建筑师 2024-07-10 Hive hadoop 数据仓库

hadoop 数据仓库 DBeaver连接含有Kerberos认证的集群的Hive表

文章目录前言1. 配置Kerberos客户端环境1.1 下载MIT Kerberos for Windows1.2 拷贝krb5.conf1.3 配置环境变量1.4 认证2. DBeaver连接hive2.1 配置dbeav...

数据库

5查看

0评论
AI智慧之源 2024-07-10 大数据 Hive hadoop

hadoop 大数据-hive，初步了解

1. Hive是什么Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性，因此使用Hive构建的数据仓库也秉承了这些特性。简单来说，Hive就是在Hadoop上架了...

数据库

3查看

1评论
技术解疑小指南针 2024-07-10 hadoop Hive 知识图谱

人工智能数据可视化推荐算法计算机毕业设计hadoop+spark+hive知识图谱音乐推荐系统音乐数据分析可视化大屏音乐爬虫 LSTM情感分析大数据毕设深度学习机器学习

新余学院本科毕业设计(论文开题报告学号 202253025 学生姓名毛维星届别 24届专业数据科学与大数据技术指导教师姓名及职称潘诚研究生毕业设计 (论文题...

数据库

7查看

0评论
人工智能软件开发 2024-07-07 Hive 大数据 hql

大数据海豚调度器3.0.0 ds3.0.0 Dolphinscheduler3.0.0使用（二）hive（HQL）的工作流使用

1.8. 创建hive工作流定义1.9. Hive工作流上线运行1.10. 查看hive工作流任务实例日志...

数据库

3查看

1评论
IT职场生存法则 2024-07-06 Hive sql

面试题1（京东）之HiveSql --- 难度：入门初级

第1题有如下的用户访问数据要求使用SQL统计出每个用户的累积访问次数，如下表所示：用户id月份小计累积u012017-011111u012017-021223u022017-011212u032017-0188u042017...

数据库

4查看

1评论
未来教育黑客手册 2024-07-06 大数据 Hive hadoop

hadoop 数据仓库 sql big data hdfs 摸鱼大数据——Hive表操作——分区表

1、介绍特点: 分区表会在HDFS上产生目录。查询数据的时候使用分区字段筛选数据，可以避免全表扫描，从而提升查询效率注意: 如果是分区表，在查询数据的时候，如果没有使用分区字段，它回去进行全表扫描，会降低效率只需要记住一点...

数据库

6查看

0评论
中学IT技术梦想家 2024-07-06 Java hadoop Hive

hadoop hive java.lang.RuntimeException: java.io.IOException: Couldn‘t create proxy provider null错误解决

在搭建完Hadoop高可用集群在，在运行Hive客户端时报错. 我们再往下看：从这里可以看出是再配置时ConfiguredFailoverProxyProvider not found出了问题。进入配置文件查看果然，再这里加...

数据库

4查看

1评论
未来零售技术观 2024-07-04 生活 MapReduce Hive

生活 mapreduce hbase 两种方法把数据导入到Hive

一，在Hive中，我们可以本地数据上传到hive,也可以本地数据上传到HDFS，然后再从HDFS中加载到Hive表中。了解一下hive的导入数据的方法语句方法一：使用 LOAD DATA INPATH 语句创建Hive表：首...

数据库

6查看

1评论
金融科技浪潮 2024-07-01 hadoop Hive 知识图谱

推荐算法计算机毕业设计hadoop+spark+hive知识图谱股票推荐系统股票数据分析可视化大屏股票基金爬虫股票基金大数据机器学习大数据毕业设计

哈尔滨理工大学毕业设计中期检查报告题目：基于Spark的股票大数据分析及可视化系统院系：计算机科学与技术学院数据科学与大数据技术 ...

数据库

6查看

1评论
科技趋势风向标 2024-06-24 Hive hadoop 数据仓库

hadoop 数据仓库 HIVE基本使用

Hive描述以分布式的形式，执行SQL语句，进行数据统计分析，将SQL语句翻译成MapReduce程序运行 Hive核心架构元数据管理，称之为Metastore服务SQL解析器（Driver驱动程序），完成SQL解析、执...

数据库

6查看

1评论
IT技能优化速成策略 2024-06-22 Hive hadoop 数据仓库

hadoop 第 1 章 Hive 数据仓库

1.数据仓库基本概念1.1什么是 Hive1）hive 简介：Hive：由 Facebook 开源用于解决海量结构化日志的数据统计工具。 Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件...

数据库

8查看

2评论
IT武林秘技 2024-06-21 servlet Java Hive

hive JavaWeb之Servlet技术(二)，java物联网开发教程

答案是访问/hello 指定了固有的映射路径优先级最高，如果找不到就会走默认的处理请求带有通配符的映射方式，有斜杠/的比没斜杠/的优先级高例3比例5的优先级高1.4、Servlet生命周期对象的生命周期，就是对象从...

数据库

6查看

0评论
自动化测试先锋营 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库【Hive】（十四）Hive 项目实战之电子商务消费行为分析

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线...

数据库

7查看

0评论
机器人与深海探测 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库 Hive的安装、配置

前言一. 环境准备：二. 下载Hive：三. 解压Hive：四. 配置环境变量：五. 配置Hive：六. 配置Hive-site.xml：七. 格式化Hive的HDFS目录：八. 启动Hive Metastore服务：九....

数据库

10查看

0评论
云计算浅谈 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库 hive中Distinct和group by去重的对比

在Hive中， DISTINCT和GROUP BY都可以用于去重，但是它们背后的实现方式是不同的，因此它们的效率也是不同的。 DISTINCT是一种去重方法，它会扫描整个数据集，然后将重复的记录...

数据库

5查看

0评论
智能创意代码库 2024-06-20 Hive 大数据 spark

大数据 python PySpark读取Hive数据并发送监控邮件【示例】

目录一、启动文件二、执行文件三、免费资源下载【完整代码】一、启动文件spark参数配置，默认即可无需修改 spark-submit方式启动程序二、执行文件HTML数据组装和Hive数据查询，生成表格数据并返回HTML 邮...

数据库

6查看

0评论
技术奇点观测站 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库 hive内置函数--floor,ceil,rand三种取整函数

文中三种取整函数操作目录：一、向下取整函数: floor二、向上取整函数: ceil三、取随机数函数: rand一、向下取整函数: floor语法: floor(doub...

数据库

6查看

0评论
代码管理与协作智慧 2024-06-20 大数据 Hive spark

【大数据技术】Hive on spark 与Spark on hive 的区别与联系

【大数据技术】Hive on spark 与Spark on hive 的区别与联系Hive on Spark Hive 既作为存储元数据又负责sql的解析优化，遵守HQL语法，执行引擎变成了spark，底层由spark负责...

数据库

11查看

3评论
科技与社会责任谈 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库 Hive行转列[一行拆分成多行/一列拆分成多列]

场景：hive有张表armmttxn_tmp，其中有一个字段lot_number，该字段以逗号分隔开多个值，每个值又以冒号来分割料号和数量，如：A3220089:-40,A3220090:-40,A3220091:-40,A...

数据库

7查看

0评论
网络智慧聚变 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库数仓-hive DDL (带你手敲秒懂hive三种常见分区)

hive 数仓DDL 分区分区是将表的数据以分区字段的值作为目录去存储---˃ 减少磁盘IO，方便数据管理静态分区创建外表同时指定静态分区字段 create table if not exists table_name(...

数据库

5查看

0评论
技术探索者札记 2024-06-20 Hive hadoop HDFS

hadoop hdfs 大数据 Hive3.1.2分区与排序（内置函数）

Hive3.1.2分区与排序（内置函数）1、Hive分区(十分重要！！分区的目的：避免全表扫描，加快查询速度！在大数据中，最常见的一种思想就是分治，我们可以把大的文件切割划分成一个个的小的文件，这样每次操作一个个小的文件就...

数据库

5查看

0评论
未来科技生活趋势观察站 2024-06-20 spark 大数据分布式

大数据分布式 zookeeper hadoop hive hbase 头歌：Spark案例剖析 - 谷歌网页排名引擎PageRank实战

第1关：海量数据导入：SparkSQL大数据导入处理任务描述工欲善其事必先利其器，大数据分析中最重要的是熟练掌握数据导入工具的使用方法。Spark SQL是Spark自带的数据库，本关你将应用Spark SQL的数据导入工...

数据库

5查看

0评论
3c设备是什么 2024-06-19 Hive hadoop 数据仓库

hadoop 数据仓库 hive-窗口函数

1 窗口函数语法分析函数/专用窗口函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置常用的分析函数常用的分析函数：sum( 、max( 、min( ...

数据库

4查看

0评论
AI趋势洞察室 2024-06-19 Hive hadoop 数据仓库

hadoop 数据仓库搭建hive环境,并解决后启动hive命令报 hive: command not found的问题

一、问题解决 1、问题复现2、解决问题查阅资料得知该问题大部分是环境变量配置出了问题，我就输入以下命令进入配置文件检查自己的环境变量配置：检查发现自己的hive配置没有问题，于是我就退出，然...

数据库

6查看

1评论
安防金钟罩 2024-06-19 Hive 学习笔记

柚子快报激活码778899分享：Hive语法，函数--学习笔记

1，排序处理1.1cluster by排序，在Hive中使用order by排序时是全表扫描，且仅使用一个Reduce完成。在海量数据待排序查询处理时，可以采用【先分桶再排序】的策略提升效率。此时，就可以使用cluste...

数据库

4查看

0评论
技术大神的开源宝藏 2024-06-19 Hive 位图 Bitmap

roaringbitmap Hive 实战：位图 Bitmap 系列-位图计算函数

1. 简介ClickHouse 提供了一系列用于位图索引和计算的函数，这些功能特别适用于处理大量的分布式聚合，可以高效地进行复杂的位运算。而在 Hive 中没有内置的等效函数，我们可以通过创建用户自定义函数来实现。在这我们基...

数据库

5查看

0评论
智能技术趋势谈 2024-06-19 Mysql 数据库 Hive

数据库 Ubuntu部署hive报错HiveMetaException,mysql.CommunicationsException : Communications link failure

Ubuntu使用bin/schematool -initSchema -dbType mysql -verbos命令部署hive报错mysql连接失败根据文章Underlying cause: com.mysql.cj.jd...

数据库

5查看

1评论
未来人机共生论 2024-06-19 Hive

柚子快报邀请码778899分享：hive3.1.2分区与排序

1.Hive分区（很重要）分区的目的：避免全局扫描，加快查询速度！思想：分而治之，把大的文件切割划分成一个个小文件，然后操作一个个小文件。1.2 静态分区（sp 1.2.1 创建单分区表语法：-- 分区的字段不要和表的字...

数据库

11查看

3评论
深度学习视界 2024-06-19 Hive hadoop jvm

hadoop jvm 大数据数据仓库 hive优化参数map,reduce优化

目录har小文件归档hive调优参数hive 调优扩展优化动态分区属性数据建模维度建模硬刚Hive | 4万字基础调优面试小总结 - 知乎 (zhihu.com har小文件归档--用来控制归档是否可用--通知Hive在创...

数据库

6查看

0评论
技术思考者笔记 2024-06-18 Hive 数据库 hadoop

hadoop hive实验 1.创建数据库，数据库名： db

所有操作基于xshell和DG首先应该保证hive与DG连接是成功的，不然无法继续进行后续操作实验内容1.创建数据库，数据库名： db_experiment2.切换到创建好的数据库： db_experiment3.创建表：学...

数据库

5查看

0评论
智械成长手账 2024-06-18 大数据 hadoop spark

hadoop spark 数据仓库 hive 大数据应用的重要性体现在方方面面

大数据应用的重要性，自全国提出“数据中国”的概念以来，我们周围默默地在发挥作用的大数据逐渐深入人们的心中，大数据的应用也越来越广泛，具体到金融、汽车、餐饮、电信、能源、体育和娱乐等领域，下面就通过本文，让我们看看这些正在发生...

数据库

6查看

1评论
技术问答便利店 2024-06-18 Hive hadoop 数据仓库

hadoop 数据仓库 Hive中的复杂数据类型 - array、map、struct

水善利万物而不争，处众人之所恶，故几于道文章目录一、简单数据类型（复习）二、复杂数据类型array（数组）map（集合）struct（结构体）一、简单数据类型（复习）官方数据类型详情页数据类型描述范围tinyint1byt...

数据库

5查看

0评论
安全卫士道 2024-06-18 Hive 旅游 hadoop

hadoop 计算机java项目｜springboot基于hive旅游数据的分析与应用

作者主页：编程指南针作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师主要内容：Java项目、Python项目、前...

数据库

7查看

0评论
大学程序创想阁 2024-06-18 hadoop Hive apache

解决hive on sparkExecution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTas

报错：解析：我的集群是5个节点的，hive在节点1上安装，而节点2的hdfs状态为active，其他节点hdfs状态为standby，节点状态为standby是没法访问到集群资源的，如下图：所以节点1的状态为standby的...

数据库

5查看

0评论
技术初探者部落格 2024-06-18 Hive hadoop 数据仓库

hadoop 数据仓库 Hive的存储格式和压缩算法的特点和选择

1、数据存储格式： HIVE 中默认的存储格式；一般使用在数据贴源层(ODS 或 STG ，针对需要使用脚本 LOAD 加载数据到 HIVE 数仓表中的情况；需要把表里数据导出或直接可以查看等场景，作为BI供...

数据库

5查看

0评论
大宗师的博客 2024-06-17 Hive hadoop count

hadoop 大数据 HQL Hive中count(1)结果为0的解决办法

问题描述 hive中执行count(1 函数，统计结果为0 问题分析执行count(1 或count(* 统计行数时，默认会从Hive的元数据库中查询 rowsNum 对应值作为结果返回。但是如果是使用加载数据文件loa...

数据库

6查看

0评论
开源技术猎奇室 2024-06-17 bug hadoop Hive

hadoop spark hive3.X的HiveServer2 内存泄漏问题定位与优化方案（bug）

参考文档： https://juejin.cn/post/7141331245627080735?searchId=20230920140418F85636A0735C03971F71官网社区： https://issues...

数据库

5查看

0评论
安全防护前线 2024-06-17 Hive hadoop 数据仓库

hadoop 数据仓库 HIVE无法启动问题

启动不了hive 一直在加载中！问题：当我们打开电脑想要学习hive时我们却发现它一直卡在启动页面 true一直后没有信息或者报错原因：我们在之前学习时在配置hdfs的高可用时（High Availability ...

数据库

6查看

0评论
校园技术梦想孵化器 2024-06-17 Hive hadoop 数据仓库

hadoop 数据仓库 Hive日志介绍

日志描述日志路径：Hive相关日志的默认存储路径为“/var/log/Bigdata/hive/角色名”，Hive1相关日志的默认存储路径为“/var/log/Bigdata/hive1/角色名”，以此类推。HiveServ...

数据库

5查看

1评论
云中漫步技术谈 2024-06-17 sql Java 数据库

数据库 hive 大数据 jdbc impala查询报错， java.sql.SQLException: [Simba][ImpalaJDBCDriver](500051) ERROR processing query/sta

建立jdbc impala 报错 url ：jdbc:impala://iphost:25004/dbname 后面加上 ;UseSasl=0;AuthMech=3;UID=impala;PWD=就好了变更后 jdbc:im...

数据库

7查看

0评论
编程实战智慧锦囊 2024-06-17 Hive 学习笔记

hive学习笔记之六：HiveQL基础

该查询会触发MR计算，结果如下：试试嵌套查询，内部是查出city字段带有a字母的记录，然后将这些记录按照province字段分组：结果如下：前面的嵌套查询，结果有两个省：guangdong和shanxi，如果再加个条件：只显...

数据库

5查看

0评论
技术深研思享会 2024-06-17 Hive hadoop 数据仓库

hadoop 数据仓库 Hive的小文件处理

针对ORC存储格式的小文件--orc合并小文件的特定语法,使用concatenate(连接、使连续关键字--非分区表--分区表针对TEXTFILE存储格式的小文件--将这些小文件进行合并,这里使用distribute by...

数据库

5查看

0评论
人工智能瞭望台 2024-06-17 Hive 大数据数据仓库

大数据数据仓库分布式 hadoop 出现Error: Could not open client transport with JDBC Uri: jdbc:hive2://node02:10000/；user=root:..怎么办？

最近实现hive远程部署出现一些问题，用网上的方法修改Hadoop的core-site.xml还是连不上，出现的问题又变成了Connection Refused。用这篇文章记录一下我的解决方法。一、问题描述 ...

数据库

6查看

1评论
软件测试智慧锦囊 2024-06-17 Hive sql hadoop

hadoop Hive sql 常见面试题-查询至少连续三天下单的用户

文章目录1. 题目需求2. 订单信息表：order_info3. 查询sql1. 题目需求查询订单信息表(order_info 中最少连续3天下单的用户id，期望结果如下：2. 订单信息表：order_info3. 查询sq...

数据库

6查看

0评论

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28