hadoop - 金钥匙

网站首页 > hadoop

IT小学堂智慧树 2024-07-25 hadoop 大数据 HDFS

大数据 hdfs Hadoop集群的配置

一.、创建虚拟机(10条消息 CentOS 7 虚拟机的搭建_仄言2997的博客-CSDN博客 1. 创建虚拟机 2. 安装 CentOS 二、虚拟机网络设置(10条消息虚拟机网络配置_仄言2997的博客-...

数据库

1查看

1评论
IT技术小道消息 2024-07-23 hadoop HDFS apache

Couldn‘t create proxy provider class org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverPro

问题1：Couldn’t create proxy provider class org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProhadoop处于...

数据库

6查看

0评论
编程新手的IT技术游记 2024-07-20 大数据 hadoop HDFS

hadoop hdfs Python+大数据技术框架和数仓基础(一)

Python+大数据技术框架和数仓基础(一分布式和集群的区别分布式：分布式的主要工作是分解任务，将职能拆解，多个人在一起做不同的事集群：集群主要是将同一个业务，部署在多个服务器上，多个人在一起做同样的事Hadoop介绍...

数据库

2查看

1评论
游戏编程异次元 2024-07-19 hadoop Hive apache

SQL报错信息: org.apache.hadoop.hive.ql.parse.ParseException:line 9:6 cannot recognize input near ‘＜EOF＞‘

1. 当前使用hive版本:3.1.32.报错信息:org.apache.hadoop.hive.ql.parse.ParseException:line 9:6 cannot recognize input near ''...

数据库

2查看

1评论
云原生实践分享 2024-07-18 大数据 HDFS hadoop

hadoop 【大数据复习】第3章分布式文件系统HDFS（重中之重）

一、概念1.分布式文件系统把文件分布存储到多个计算机节点上，通过网络实现、文件在多台主机上进行分布式存储的文件系统。（就是你的电脑存a，我的电脑存pple）2.降低了硬件开销:与之前使用多个处理器和专用高级硬件的并行化处理装...

数据库

3查看

1评论
编程奇境探险队 2024-07-17 HDFS hadoop 大数据

hadoop 大数据 HDFS上传文件的过程

hdfs上传文件的过程：以 hadoop fs -put a.txt /dir 为例 1、客户端向服务器发起上传请求（用rpc协议） 2、namenode收到请求后会进行权限检查：（1）看是否有操作权限（2）父目录是否存在...

数据库

5查看

1评论
科技晨曦轩 2024-07-15 分布式 hadoop spark

hadoop伪分布式+spark环境+scala环境

目录基础环境1.修改主机名2.网络映射java环境配置1.查看Linux是否安装了java jdk，如果查询有其他的java版本，则需要删除2.解压，压缩包与重命名3.修改java环境变量4.配置文件生效 source /e...

后端

6查看

0评论
AI艺术创新工作坊 2024-07-12 hadoop 大数据

大数据 Hadoop-命令操作整理

HDFS 命令-ignoreCrc忽略检查验证-v显示文件块的大小更改文件的组关联。用户必须是文件的所有者，或者是超级用户。其他信息在权限指南中。-R将文件的组关联进行递归更改-R将文件使用权限进行递归更改-R递归更改将文件...

数据库

4查看

2评论
金融科技产品解析 2024-07-11 hadoop 大数据分布式

大数据分布式 hadoop:hafs:上传文件、删除文件、改变文件权限等常用命令

Hadoop是一个开源的分布式计算框架，用于处理和分析大数据集。Hadoop提供了大量的命令来管理集群、处理数据以及执行其他相关任务。以下是一些常用的Hadoop命令的汇总：1 启动和关闭Hadoop服务启动所有Hadoo...

数据库

3查看

1评论
未来能源科技展望 2024-07-11 Hive 数据仓库 hadoop

hadoop hive数据仓库搭建

一、虚拟机安装CentOS7并配置共享文件夹二、CentOS 7 上hadoop伪分布式搭建全流程完整教程三、本机使用python操作hdfs搭建及常见问题四、mapreduce搭建五、mapper-reducer编...

数据库

3查看

1评论
代码梦想建筑师 2024-07-10 Hive hadoop 数据仓库

hadoop 数据仓库 DBeaver连接含有Kerberos认证的集群的Hive表

文章目录前言1. 配置Kerberos客户端环境1.1 下载MIT Kerberos for Windows1.2 拷贝krb5.conf1.3 配置环境变量1.4 认证2. DBeaver连接hive2.1 配置dbeav...

数据库

5查看

0评论
AI智慧之源 2024-07-10 大数据 Hive hadoop

hadoop 大数据-hive，初步了解

1. Hive是什么Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性，因此使用Hive构建的数据仓库也秉承了这些特性。简单来说，Hive就是在Hadoop上架了...

数据库

3查看

1评论
科技探照灯 2024-07-06 hadoop Mysql 数据库

数据库利用Spark进行房地产分析 #Hadoop Spark Mysql

文章目录文章目录前言背景数据介绍指标介绍1.城区和街道进行数量统计，分析房产分布和热门地区。2.分析房产数据表中不同建造年份的房产数量情况3.分析不同地区、楼层和户型的房产平均单价和总价的计算，高价房产的识别（价格超过 10...

数据库

3查看

1评论
中学IT技术梦想家 2024-07-06 Java hadoop Hive

hadoop hive java.lang.RuntimeException: java.io.IOException: Couldn‘t create proxy provider null错误解决

在搭建完Hadoop高可用集群在，在运行Hive客户端时报错. 我们再往下看：从这里可以看出是再配置时ConfiguredFailoverProxyProvider not found出了问题。进入配置文件查看果然，再这里加...

数据库

4查看

1评论
开源编程心旅行笔记 2024-07-06 大数据 hadoop spark

毕业设计选题计算机毕设项目计算机毕业设计【项目实战】基于Spark大数据的餐饮外卖数据分析可视化系统hadoop项目hive计算机程序设计

注意：该项目只展示部分功能，如需了解，评论区咨询即可。本文目录1 设计背景2设计意义3 系统展示3.1 页面展示3.2 视频展示4 更多推荐5 部分功能代码1 设计背景随着互联网和移动技术的飞速发展，餐饮外卖行业已经成为现代...

数据库

6查看

1评论
青春编程梦想工程师 2024-07-04 hbase hadoop 大数据

大数据 Hbase运行时出现的问题，hadoop适配hbase版本

Hadoop-3.3.4适配hbase版本Hbase-2.4.17（本人试用通过）遇到的问题：问题1.Hbase 的Hmaster 在运行一段时间后自动关闭 Case1：集群处于安全模式，解决方法：关闭安全模式，再重...

数据库

4查看

1评论
安全守夜人日记 2024-07-04 HDFS hadoop 大数据

hadoop 大数据 HDFS主节点DataNode正常启动但是从节点jps没有DataNode进程[已解决]

问题：今天在学习的时候遇到的问题：HDFS主节点DataNode正常启动但是从节点jps没有DataNode进程在主节点直接start-dfs.sh全部启动HDFS之后jps发现没有DataNode，或者主节点有DataNo...

开发工具

4查看

1评论
人工智能浪潮 2024-07-04 大数据人工智能课程设计

课程设计 hadoop 推荐算法大数据毕业设计python+spark高考志愿填报推荐系统高考用户画像系统高考分数线预测系统高考可视化知识图谱高考爬虫计算机毕业设计机器学习深度学习人工智能数据可视化

高考大数据目前4个版本：【本网页所在的视频属于V3.0.0完整版录屏】 V1.0.0(丐帮版，推荐采用手动推荐 V2.0.0(中配版，推荐采用手动推荐+协同过滤，无爬虫、无lstm情感分析 V3.0.0(完整版，推荐、...

人工智能

9查看

3评论
远程协作高效手册 2024-07-03 1024程序员节大数据 Java

1024程序员节大数据 java hdfs Hadoop2.x-基础(MapReduce)

Hadoop2.x-基础(MapReduce MapReduce简介MapReduce是一个分布式运算程序的编程框架，是用户开发“基于Hadoop的数据分析应用”的核心框架MapReduce核心功能是将用户编写的业务代码和自...

数据库

4查看

1评论
开源编程心旅行记 2024-07-02 hadoop zookeeper hbase

hadoop zookeeper 搭建HBase伪分布式集群

...

数据库

4查看

1评论
金融科技浪潮 2024-07-01 hadoop Hive 知识图谱

推荐算法计算机毕业设计hadoop+spark+hive知识图谱股票推荐系统股票数据分析可视化大屏股票基金爬虫股票基金大数据机器学习大数据毕业设计

哈尔滨理工大学毕业设计中期检查报告题目：基于Spark的股票大数据分析及可视化系统院系：计算机科学与技术学院数据科学与大数据技术 ...

数据库

6查看

1评论
算法魔法研习社 2024-06-30 hadoop

hadoop master: ssh: Could not resolve hostname master: Name or service not known的解决方法

第一种解决方法是未修改linux系统中的host文件，这个在其他人的文章中又阐述，这里就不做介绍。如果第一种解决方法不能解决，则可以用如下的方法：如图，在真机器的如下的文件路径中搜索并修改host文件搜索“命令提示符”，点击...

运维

7查看

2评论
机器人与可持续发展 2024-06-30 开源大数据智慧城市

智慧城市程序人生 hadoop flink 数据仓库开源大数据项目推荐：引领数据时代的创新力量

随着开源项目的蓬勃发展，越来越多的程序员和数据科学家开始关注并积极参与到开源大数据项目中。这些项目不仅推动了技术的进步，也为行业带来了诸多创新应用。本文将推荐几个当前热门的大数据开源项目，分析其技术亮点、实际应用以及对行业的...

综合

6查看

1评论
技术进修部落格 2024-06-29 spark hadoop 大数据

大数据分析与内存计算——Spark安装以及Hadoop操作——注意事项

一、Spark安装1.相关链接Spark安装和编程实践（Spark3.4.0）_厦大数据库实验室博客 (xmu.edu.cn 2.安装Spark（Local模式）按照文章中的步骤安装即可遇到问题：xshell以及xftp不能...

数据库

7查看

1评论
区块链+行业应用 2024-06-27 centos 网络 linux

linux 运维服务器 hadoop centos虚拟机ping不通网络原因与解决(unknown host www.baidu.com),节点之间unreachable

错误:unknown host www.baidu.com原因:Mac地址不一致引起解决方法:本身虚拟机Mac地址是否与文件一致操作步骤1修改虚拟机网卡配置文件,配置网卡设备的mac地址①编辑虚拟机网卡配置文件指令 ②注释无...

运维

8查看

1评论
编程与逻辑艺境 2024-06-27 hadoop HDFS 大数据

hadoop 大数据使用HDFS Shell和HDFS 的Java访问接口进行文件操作，完成从本地文件hello.txt拷贝至HDFS系统/test目录下操作。

使用HDFS Shell 完成本地文件hello1.txt拷贝至HDFS系统/test目录下操作1.1创建test目录创建hdfs文件虚拟目录；创建/user/hadoop/test目录；并使用，./bin/hdfs...

数据库

6查看

0评论
科技星辰大海 2024-06-25 flink hadoop HDFS

hdfs flink 1.13 Hadoop3.22踩坑

看情况持续更新吧坑1./bin/flink run -m yarn-cluster ./examples/batch/WordCount.jar --input hdfs://hadoop3/flink_test/data/...

数据库

4查看

0评论
AI与个人隐私保护 2024-06-25 hbase apache hadoop

分布式 zookeeper Hbase shell：创建表ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing

Hbase shell创建表时出现以下错误解决方法：在zookeeper服务端启动的情况下，将zookeeper客户端的hbase删除步骤：zookeeper服务端启动进入zookeeper客户端接着再重新启动hadoop，...

后端

7查看

1评论
科技趋势风向标 2024-06-24 Hive hadoop 数据仓库

hadoop 数据仓库 HIVE基本使用

Hive描述以分布式的形式，执行SQL语句，进行数据统计分析，将SQL语句翻译成MapReduce程序运行 Hive核心架构元数据管理，称之为Metastore服务SQL解析器（Driver驱动程序），完成SQL解析、执...

数据库

6查看

1评论
物联网智慧连线 2024-06-22 HDFS hadoop 大数据

hadoop 大数据配置HDFS单机版，打造数据存储的强大解决方案

目录简介：步骤：安装java下载安装hadoop配置hadoop-env.sh配置 core-site.xml配置hdfs-site.xml初始化hdfs文件系统启动hdfs服务验证hdfs结论：简介：Hadoop分布式文件...

数据库

7查看

1评论
IT技能优化速成策略 2024-06-22 Hive hadoop 数据仓库

hadoop 第 1 章 Hive 数据仓库

1.数据仓库基本概念1.1什么是 Hive1）hive 简介：Hive：由 Facebook 开源用于解决海量结构化日志的数据统计工具。 Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件...

数据库

8查看

2评论
编码奇境漫游 2024-06-21 HDFS hadoop linux

hadoop linux HDFS 常用命令

一、HDFS常用命令1、查看版本2、创建 HDFS 文件系统目录。格式：3、列出目录下的所有文件类似 Linux Shell 的 ls 命令。用它可以列出指定目录下的所有文件4、把本地文件系统文件和目录拷贝到 HDFS。格...

数据库

5查看

1评论
机器学习实战营 2024-06-21 分布式 hadoop 大数据

大数据零基础也能学会！Hadoop伪分布式集群安装与配置实践

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或...

数据库

8查看

2评论
自动化测试先锋营 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库【Hive】（十四）Hive 项目实战之电子商务消费行为分析

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线...

数据库

7查看

0评论
机器人与深海探测 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库 Hive的安装、配置

前言一. 环境准备：二. 下载Hive：三. 解压Hive：四. 配置环境变量：五. 配置Hive：六. 配置Hive-site.xml：七. 格式化Hive的HDFS目录：八. 启动Hive Metastore服务：九....

数据库

10查看

0评论
云计算浅谈 2024-06-21 Hive hadoop 数据仓库

hadoop 数据仓库 hive中Distinct和group by去重的对比

在Hive中， DISTINCT和GROUP BY都可以用于去重，但是它们背后的实现方式是不同的，因此它们的效率也是不同的。 DISTINCT是一种去重方法，它会扫描整个数据集，然后将重复的记录...

数据库

5查看

0评论
技术奇点观测站 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库 hive内置函数--floor,ceil,rand三种取整函数

文中三种取整函数操作目录：一、向下取整函数: floor二、向上取整函数: ceil三、取随机数函数: rand一、向下取整函数: floor语法: floor(doub...

数据库

6查看

0评论
科技与社会责任谈 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库 Hive行转列[一行拆分成多行/一列拆分成多列]

场景：hive有张表armmttxn_tmp，其中有一个字段lot_number，该字段以逗号分隔开多个值，每个值又以冒号来分割料号和数量，如：A3220089:-40,A3220090:-40,A3220091:-40,A...

数据库

7查看

0评论
网络智慧聚变 2024-06-20 Hive hadoop 数据仓库

hadoop 数据仓库数仓-hive DDL (带你手敲秒懂hive三种常见分区)

hive 数仓DDL 分区分区是将表的数据以分区字段的值作为目录去存储---˃ 减少磁盘IO，方便数据管理静态分区创建外表同时指定静态分区字段 create table if not exists table_name(...

数据库

5查看

0评论
技术探索者札记 2024-06-20 Hive hadoop HDFS

hadoop hdfs 大数据 Hive3.1.2分区与排序（内置函数）

Hive3.1.2分区与排序（内置函数）1、Hive分区(十分重要！！分区的目的：避免全表扫描，加快查询速度！在大数据中，最常见的一种思想就是分治，我们可以把大的文件切割划分成一个个的小的文件，这样每次操作一个个小的文件就...

数据库

5查看

0评论
远程工作优化指南 2024-06-20 hadoop 大数据分布式

大数据分布式 Hadoop简介、安装与环境变量配置

目前最新版的Hadoop官方文档显示，Hadoop支持Java8和Java11（运行时）。为了更好的兼容Hadoop的使用，本系统采用OpenJDK SE 8版本。OpenJDK SE 8 下载地址OpenJDK SE 8下...

数据库

6查看

0评论
IT技能实战精讲 2024-06-20 HDFS hadoop 大数据

hadoop 大数据 HDFS读写数据流程

HDFS写入数据流程：客户端Client创建一个DistributedFileSystem(分步式文件系统向Name Node请求上传文件； NameNode检查目录树是否可以创建文件(检查权限，是否允许上传；检查目录是...

数据库

8查看

3评论
未来科技生活趋势观察站 2024-06-20 spark 大数据分布式

大数据分布式 zookeeper hadoop hive hbase 头歌：Spark案例剖析 - 谷歌网页排名引擎PageRank实战

第1关：海量数据导入：SparkSQL大数据导入处理任务描述工欲善其事必先利其器，大数据分析中最重要的是熟练掌握数据导入工具的使用方法。Spark SQL是Spark自带的数据库，本关你将应用Spark SQL的数据导入工...

数据库

5查看

0评论
3c设备是什么 2024-06-19 Hive hadoop 数据仓库

hadoop 数据仓库 hive-窗口函数

1 窗口函数语法分析函数/专用窗口函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置常用的分析函数常用的分析函数：sum( 、max( 、min( ...

数据库

4查看

0评论
AI趋势洞察室 2024-06-19 Hive hadoop 数据仓库

hadoop 数据仓库搭建hive环境,并解决后启动hive命令报 hive: command not found的问题

一、问题解决 1、问题复现2、解决问题查阅资料得知该问题大部分是环境变量配置出了问题，我就输入以下命令进入配置文件检查自己的环境变量配置：检查发现自己的hive配置没有问题，于是我就退出，然...

数据库

6查看

1评论
编程初学者的灯塔 2024-06-19 金融智慧城市大数据

大数据数据仓库 hadoop mysql flink 流批一体 | 实时数据典型应用场景（金融、政务、智慧城市、制造）

实时数据已是企业数字化转型的关键驱动力。什么是实时数据处理实时数据处理是指对数据在其产生时刻进行即时收集、加工和分析的过程。通过实时数据处理，企业可以及时获取、处理和应用数据，从而迅速做出决策、发现商机，并最大程度地挖掘信息...

数据库

7查看

0评论
深度学习视界 2024-06-19 Hive hadoop jvm

hadoop jvm 大数据数据仓库 hive优化参数map,reduce优化

目录har小文件归档hive调优参数hive 调优扩展优化动态分区属性数据建模维度建模硬刚Hive | 4万字基础调优面试小总结 - 知乎 (zhihu.com har小文件归档--用来控制归档是否可用--通知Hive在创...

数据库

6查看

0评论
未来科技生活梦想实现室 2024-06-19 hadoop Java HDFS

Hadoop系统应用之HDFS相关操作 - - Java-API对HDFS的操作（IDEA版）

一、实验目标通过Java API来操作HDFS文件系统HDFS，相关的操作有：文件上传、文件下载、新建文件夹、查看文件、删除文件。二、条件准备1.Linux下安装好hadoop，这里使用hadoop2.7.32.window...

数据库

5查看

0评论
DevOps实践笔记 2024-06-19 hadoop HDFS 大数据

hadoop 大数据 HDFS高可用

HDFS的高可用指的是HDFS持续对各类客户端提供读、写服务的能力。因为客户端对HDFS的读、写操作之前都要访问NameNode服务器，客户端只有从NameNode获取元数据之后才能继续进行读、写，所以 HD...

数据库

5查看

0评论
密码学安全手册 2024-06-19 HDFS apache hadoop

hadoop Apache Arrow User Guide——使用Apache Arrow读写HDFS中的parquet文件

安装一下HADOOP并配置一下LD_LIBRARY_PATH这几个库目前用不到，但是CMakeLists.txt里面会用到一个libhdfs.so。后面再说。完事以后就可以用Apache Arrow来读写HDFS的parqu...

数据库

5查看

0评论

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30