HDFS - 第4页 - 金钥匙

网站首页 > HDFS 第4页

微软有什么用 2024-05-08 hadoop HDFS 大数据

大数据【Hadoop】HDFS中Namenode和SecondaryNameNode的工作流程

往期文章HDFS简介——是什么/优缺点/适用场景 HDFS设计思想 HDFS的体系架构集群配置之主要配置文件（hadoop-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml、ma...

数据库

7查看

0评论
开源平台 2024-04-25 HDFS hadoop 大数据

hadoop 大数据 hdfs中的租约机制及Flink写hdfs文件未关闭及ORC

一文读懂Hive底层数据存储格式（好文收藏）-腾讯云开发者社区-腾讯云在HDFS中，租约机制是用来管理文件的写入和编辑操作的一种机制。租约机制包括主租约和副租约两种类型。主租约是由文件的创建者持有的，它控制着文件的写入和编...

数据库

5查看

0评论
Windows开发 2024-04-16 HDFS hadoop 大数据

hadoop 大数据分布式 HDFS的架构优势与基本操作

目录写在前面一、 HDFS概述1.1 HDFS简介1.2 HDFS优缺点1.2.1 优点1.2.2 缺点1.3 HDFS组成架构1.4 HDFS文件块大小二、HDFS的Shell操作（开发重点）2.1 基本语法2.2 命令大...

后端

5查看

0评论
微软不开发新系统 2024-04-13 Mysql maven intellij-idea

intellij-idea hdfs linux maven中使用MySQL

关于maven使用MySql的介绍MYSQL版本：开发环境pom未导入jdbc的jar包时效果：在maven中导入mysql的jar包操作运行结果重新测试MYSQL版本：博主目前使用的是MySQL-5.6.17，win64开...

数据库

5查看

0评论
体验式营销的例子 2024-04-06 hadoop HDFS MapReduce

大数据解析Hadoop三大核心组件：HDFS、MapReduce和YARN

目录HadoopHadoop的优势Hadoop的组成HDFS架构设计Yarn架构设计MapReduce架构设计总结在大数据时代，Hadoop作为一种开源的分布式计算框架，已经成为处理大规模数据的首选工具。它采用了分布式存储和...

数据库

6查看

0评论
架构技术专栏 2024-03-24 大数据 HDFS flink

大数据 hdfs flink hadoop 数据仓库 Alluxio安装部署

简介Alluxio 是世界上第一个虚拟的分布式存储系统，以内存速度统一了数据访问。它为计算框架和存储系统构建了桥梁，使应用程序能够通过一个公共接口连接到许多存储系统。 Alluxio以内存为中心的架构使得数据的访问速度能比...

数据库

5查看

0评论
程序员水平资格考试 2024-03-24 HDFS hadoop 大数据

hadoop 大数据 CDH 之 hdfs 报错 Canary 测试无法为 /tmp/.cloudera

不良 : Canary 测试无法为 /tmp/.cloudera_health_monitoring_canary_files 创建父目录当 cloudera-scm-server 服务与 hdfs 的namenode节点不...

数据库

5查看

0评论
软件开发流程八个步骤 2024-03-24 hadoop HDFS 大数据

大数据 Hadoop-HDFS

Hadoop HDFS(Hadoop Distributed File System 是Apache Hadoop中的分布式文件系统。它是一个流行的分布式文件系统,适合运行在的集群上。HDFS的主要特征有:1. 分布式:HD...

数据库

5查看

0评论
中国大数据公司排名10强 2024-03-22 大数据 HDFS yarn

yarn 大数据特性大数据小白初探HDFS从零到入门（一）

目录1. 前言2. 大数据的诞生3.发展趋势及应用4.离线计算和实时计算5.大数据的特性1. 前言前两天把Hbase的初级入门知识整理了下，在文章中提到了“HDFS”这个大数据的基础，有同事小伙伴想要了解下这...

数据库

5查看

0评论
c语言入门自学零基础 2024-03-20 HDFS hadoop 大数据

hadoop 大数据 HDFS shell命令行

HDFS shell命令行shell命令行解释说明命令行界面（CLI：command-line interface ,用户通过键盘输入指令，计算机接受到质量后，予以执行一种人际交互方式。 Hadoop文件系统shell命...

数据库

5查看

0评论
简单编程小游戏 2024-03-20 hadoop 大数据 HDFS

hadoop 大数据 hdfs 安装部署Spark集群以及运行WordCount详细步骤

1.在安装Spark之，确保 Hadoop 已经成功安装,并且 Hadoop 已经正常启动。 Hadoop 正常启动的验证过程如下：（1）使用下面的命令，看可否正常显示 HDFS 上的目录列表（2）使用浏览器查看相应界面...

数据库

5查看

0评论
人工智能需要学哪些课程 2024-03-20 HDFS hadoop 大数据

hadoop 大数据 HDFS基础知识

什么是hdfs1 .Hadoop 分布式文件系统。是 Hadoop 核心组件之一，作为最底层的分布式存储服务而存在。分布式文件系统解决的问题就是大数据存储。为什么需要HDFS？HDFS(Hadoop Distributed...

数据库

6查看

0评论
人工智能对软件行业的影响 2024-03-20 hadoop HDFS 大数据

hdfs 大数据 Hadoop

参考资料 1. HDFS中的常用压缩算法及区别_大数据_王知无_InfoQ写作社区2. orc格式和parquet格式对比-阿里云开发者社区3.Hadoop 压缩格式 gzip/snappy/lzo/bzip2 比较与总结...

数据库

8查看

0评论
941编程网 2024-03-20 HDFS MapReduce hadoop

Hadoop3.3.6（HDFS、YARN、MapReduce）完全分布式集群安装搭建

目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、Hadoop部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件5、启动hadoo...

数据库

5查看

0评论
ai配音 2024-03-20 hadoop 大数据 HDFS

大数据 hdfs hadoop解决数据倾斜的方法

分析&回答1，如果预聚合不影响最终结果，可以使用conbine，提前对数据聚合，减少数据量。使用combinner合并,combinner是在map阶段,reduce之前的一个中间阶段,在这个阶段可以选择性的把大量的相同ke...

数据库

5查看

0评论
数据结构与算法 2024-03-15 hadoop HDFS 服务器

三台异构服务器搭建hadoop HA集群史上最详细方案（HDFS+YARN）

一、系统基础服务配置主机名IP操作系统CPU内存磁盘Hive0110.86.102.104Centos 7.9.2009Xeon 4208 X16192G46THive0210.86.102.102Centos 7.9.2...

数据库

5查看

0评论
aigc软件 2024-03-15 HDFS hadoop 大数据

hadoop 大数据 HDFS源码解析

Hadoop分布式文件系统（HDFS）是Hadoop生态系统的核心组件之一，它是一个可扩展的分布式文件系统，用于存储大量数据。本文将对HDFS的源代码进行解析，以便更好地理解其工作原理。HDFS的核心组件HDFS由三个核心组...

数据库

7查看

0评论
软件开发定制 2024-03-15 hadoop HDFS 大数据

hadoop hdfs 大数据 Apachehive客户端启动无法连接的问题

在进行基础连接的时候，启动hive报错了大致意思是初始化连接node1时报错原因是：未启动集群启动这两条命令就可以了...

数据库

5查看

0评论
软件开发定制 2024-03-15 HDFS hadoop 大数据

hadoop 大数据【HDFS】Block、BlockInfo、BlockInfoContiguous、BlockInfoStriped的分析记录

本文主要介绍如下内容：关于几个Block类之间的继承、实现关系；针对文章标题中的每个类，细化到每个成员去注释分析列出、并详细分析BlockInfo抽象类提供的抽象方法、非抽象方法的功能针对几个跟块组织结构的方法再进行分析。m...

数据库

5查看

0评论
软件测试 2024-03-13 hadoop HDFS 大数据

大数据 Hadoop 3.1.1 HDFS 集群部署

Hadoop 3.1.1 HDFS 集群部署依赖服务系统优化查看 ZooKeeper 集群状态创建路径配置 /etc/profile配置 $HADOOP_HOME/etc/hadoop/hadoop-env.sh配置 $HA...

数据库

5查看

0评论
开源中国是干嘛的 2024-03-13 大数据 hadoop HDFS

大数据 hdfs yarn mapreduce Hadoop基础学习

Hadoop基础学习Hadoop介绍Hadoop现状Hadoop的优点：三高一低Hadoop的版本发展Hadoop集群整体概述HDFS集群YARN集群Hadoop集群的开启HDFS分布式文件系统介绍HDFS简介HDFS核心属...

数据库

5查看

0评论
学人工智能去哪个学校 2024-03-09 HDFS hadoop 大数据

hadoop 大数据 hbase 分布式 hdfs --daemon start datanode指令介绍

hdfs --daemon start datanode 是Hadoop分布式文件系统（HDFS）命令之一，用于启动一个数据节点（Datanode）守护进程。在HDFS中，数据节点是存储HDFS数据块的物理节点。数据节点存储...

数据库

5查看

0评论
操作系统软件 2024-03-09 hadoop hbase 大数据

hbase 大数据 hdfs 学习 hadoop报错——Exception in thread “main“ ExitCodeException exitCode=1: chmod: 无法访问没有那个文件或目录

一、前言笔者在新装的Hadoop集群中进行简单的API测试的时候，IDEA出现了一个异常，无法访问文件路径，没有那个文件或目录。在此之前，笔者做HDFS数据导入Hbase的时候，也同样出现了该异常，该异常可以...

数据库

5查看

0评论
mysql创建数据表 2024-03-08 hadoop 大数据 HDFS

大数据 hdfs 6道常见hadoop面试题及答案解析

Q1.什么是Hadoop？ Hadoop是一个开源软件框架，用于存储大量数据，并发处理/查询在具有多个商用硬件（即低成本硬件）节点的集群上的那些数据。总之，Hadoop包括以下内容： HDFS（HadoopDist...

数据库

5查看

0评论
微软不开发新系统 2024-03-06 apache hadoop HDFS

hadoop hdfs 大数据分布式 Apache DolphinScheduler 从 1.3.4 升级至3.1.2 过程中的问题记录及解决方案

点击蓝字关注我们作者 | 刘宇星，开源爱好者摘要Apache DolphinScheduler官方的升级文档提供了升级脚本，如果只是跨小版本的更新，那么只用执行脚本就好了，但跨多个大版本升级时依然容易出现各种问题，特此总结...

数据库

6查看

0评论
嵌入式培训班有必要吗 2024-03-06 hadoop HDFS 大数据

hdfs 大数据 Hadoop中配置文件重要属性释义

Hadoop的配置文件Hadoop集群中的每台计算节点都有自己的一组配置文件。Hadoop系统的早期版本只有一个配置文件:hadoop-site.xml。Hadoop系统的后续版本中按照不同的功能将其划分为多个配置文件。此...

数据库

5查看

0评论
大数据平台架构设计 2024-03-06 大数据 hadoop HDFS

Hadoop 大数据生态圈及分布式文件系统HDFS实践part2

前言问题引入（这是以前讲课的时候，给学生准备的一些问题，大家可以思考一下，对理解HDFS很有帮助）1、如果一个文件中有10个数值（一行一个，并且都是可以用int来度量），现在求10个数值的和。这个思路很简单。2、假如，这...

数据库

6查看

0评论
数据库制作 2024-03-06 spark 大数据分布式

大数据分布式 hdfs hadoop 启动Spark-Shell实现词频统计

1.启动spark和Hadoop#根目录下启动Hadoop集群在spark的sbin目录下输入2.运行Spark-Shell命令在spark/bin目录下，执行Spark-Shell命令进入Spark-Shell交互式环境上...

数据库

6查看

0评论
前端开发和后端开发的区别 2024-03-06 hadoop 大数据 HDFS

大数据 hdfs yarn 【hadoop】Hadoop 3.3.4 集群安装及简单使用

目录环境信息1. 准备1.1 服务器规划1.2 主机名及hosts文件修改1.2.1 hostname修改1.2.2 hosts文件修改1.3 创建hadoop用户（建议）1.4 为hadoop用户添加sudo权限1.5 互...

数据库

6查看

0评论
测试软件app 2024-03-06 spring boot hadoop HDFS

spring boot springboot集成hadoop3.2.4HDFS

前言记录springboot集成hadoop3.2.4版本，并且调用HDFS的相关接口，这里就不展示springboot工程的建立了，这个你们自己去建工程很多教程。一、springboot配置文件修改1.1 pom文件修改完...

数据库

6查看

0评论
云原生部署 2024-03-06 大数据分布式 hadoop

大数据分布式 hdfs Hadoop初始配置

本文章基于尚硅谷Hadoop 3.x视频进行总结，仅作为学习交流使用视频链接如下：20_尚硅谷_Hadoop_入门_IP和主机名称配置_哔哩哔哩_bilibili目录第一部分.IP和主机名称配置1.VM网络配...

数据库

6查看

0评论
大数据有哪些招聘职位 2024-03-06 hadoop HDFS big data

hdfs big data Hadoop（二）

hadoop中常见的shell命令1、如何将linux本地的数据上传到HDFS中呢？hadoop fs -put 本地的文件 HDFS中的目录hdfs dfs -put 本地的文件 HDFS中的目录2、如何创建HDFS中的文...

数据库

6查看

0评论
基本编程 2024-03-06 Java spark HDFS

工具类——Spark写入csv文件到HDFS（Java代码）

// 创建一个配置//创建hdfs文件，打开Hdfs输出流//临时保存文件...

数据库

6查看

0评论
编程教程免费视频 2024-03-06 HDFS Java hadoop

hadoop java读取hdfs文件

...

数据库

6查看

0评论
手机应用开发 2024-03-06 Java HDFS 开发语言

java hdfs 开发语言 hadoop 解决虚拟机配置没有namedone目录的问题

1.没有namedoune目录的话运行jps只有三个方法一：删除原tmp文件并新建一个tmp文件。例如：我的tmp文件实在/home/hadoop目录下就在该目录下运行 rm -rf ./tmp删除原有的tmp文件...

数据库

6查看

0评论
专业互联网软件开发 2024-03-05 zookeeper HDFS MapReduce

测试环境搭建整套大数据系统（三：搭建集群zookeeper，hdfs，mapreduce，yarn，hive）

一：搭建zk二：搭建hadoop，yarn，mapreduce。1. 安装hadoop。2. 修改java配置路径。增加以下内容java_home填写自己安装的路径。3. 修改配置文件。将以下信息填写到configurati...

数据库

6查看

0评论
软考不再参与职称 2024-02-27 linux redis 数据库

数据库 java hdfs Linux安装redis5.0.14版本详细步骤

Linux安装redis5.0.14版本详细步骤1.下载redis5.0.14安装包进入官方网站:https://redis.io/download找到redis5.0.14安装包并进行下载2.向linux服务器上传redi...

数据库

5查看

0评论
测试面试题及答案 2024-02-27 大数据 HDFS hadoop

hdfs hadoop 大数据常用端口号及配置文件

一、常用端口HDFS NameNode内部常用端口：8020/9000/9820HDFS NameNode对用户的查询端口：9870HDFS DataNode对用户的查询端口：9864YARN查看任务运行情况的端口：8088...

数据库

5查看

0评论
计算机网络通信技术 2024-02-27 hadoop 大数据 HDFS

大数据 hdfs Hadoop 集群搭建

使用三台虚拟机，搭建一个 Hadoop 集群。目录一、centos7 Minimal 版本安装配置二、Hadoop 单节点安装① 修改主机名和映射 hosts 文件② 安装 JDK③ 安装 Hadoop ④ 本地模式测试（官...

数据库

6查看

0评论
vipcode的特色课程 2024-02-27 spark Hive 大数据

大数据 hadoop hdfs spark 写代码的三种方式、spark 整合 Hive

目录spark 写代码的方式1、在IDEA中将代码编写好然后打包上传到集群中运行(使用最多 2、spark shell(REPL -- 交互式的命令行 3、spark-sql(spark的SQL命令行在进入 spark-s...

数据库

5查看

0评论
技术猿全家福 2024-02-27 hadoop 大数据 HDFS

hadoop hdfs 大数据测试方案

大数据测试是指在大数据系统中进行的功能和性能测试，以验证系统在大数据情况下的稳定性和可用性。以下是一个可能的大数据测试方案：1. 数据生成：随机生成一组大规模的测试数据，包括结构化数据、非结构化数据和流式数据，确保数据量足够...

数据库

5查看

0评论
开心编程 2024-02-19 HDFS Java hadoop

java hadoop 【大数据部署】HDFS，Yarn集群快速搭建教程（涵盖Windows与Linux中的注意事项）

目录最简单的Hadoop架构... 1伪分布式搭建... 1JDK的配置... 1Hadoop下载与安装... 4Windows系统的特殊点1. 10Windows系统的特殊点2. 11Windows的注意事项主要就是在 1...

数据库

8查看

0评论
分布式架构设计思路和要点 2024-02-19 HDFS hadoop 大数据

hadoop 大数据 HDFS原理剖析

一、概述HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是...

数据库

8查看

0评论
实用阶梯英语语法教程第三版 2024-02-19 hadoop HDFS 大数据

大数据解决Hadoop审计日志hdfs-audit.log过大的问题

【背景】新搭建的Hadoop环境没怎么用，就一个环境天天空跑，结果今天运维告诉我说有一台服务器磁盘超过80%了，真是太奇怪了，平台上就跑了几个spark测试程序，哪来的数据呢？【问题调查】既然是磁盘写满了，那首先就要找到具体...

数据库

8查看

0评论
网站搭建 2024-02-19 Hive 大数据 Mysql

大数据 mysql hdfs 从CSV文件导入Hive出现中文乱码问题解决

1、问题描述关于HIVE中文乱码问题的解决办法，网上有很多帖子，然而很多都是基于LINUX终端显示字符的修改，其实上对于一些条件下的HIVE中文乱码问题是无法解决的，如从CSV文件导入到HIVE中出现的中文乱码问题。HIVE...

数据库

8查看

0评论
软件开发任务发布平台 2024-02-19 hadoop 分布式 HDFS

hdfs 大数据容器 Hadoop完全分布式环境搭建

最近在学习hadoop，经过几番折腾终于把分布式环境搭建成功，这里总结一下搭建过程和过程中遇到的问题与解决方案。一、准备工作 1.下载vmvare软件，配置NAT网络模式 NAT是网络地址转换，是在宿主机和虚拟机之间增加一...

数据库

8查看

0评论
免费ChatGPT中文版 2024-02-19 大数据 AIGC HDFS

[AIGC 大数据基础] 浅谈hdfs

HDFS介绍什么是HDFS？HDFS（Hadoop Distributed File System）是Apache Hadoop生态系统的一部分，是一个分布式文件系统。它被设计用于存储和处理大规模数据集，并且能够容错、高可靠...

人工智能

11查看

0评论
编程培训 2024-02-19 hadoop 大数据 HDFS

大数据 hdfs 分布式 hadoop：未找到命令----解决办法

hadoop：未找到命令昨天安装hadoop后，今天想进行一些简单的练习，但是出现问题。 1.启动Hadoop：进入hadoop安装目录到这里没有启动JobTracker和TaskTracker 我觉得用下面这句更好但是会...

数据库

8查看

0评论
设计模式常见 2024-02-19 大数据 ssh 服务器

ssh 服务器 hdfs 大数据实战之配置集群

设置免密登录1）生成公钥和私钥2）密钥分发ssh-copy-id进行密钥分发，具体操作如下： [kfk@bigdata-pro01 ~]$ ssh-copy-id bigdata-pro02 /bin/ssh-copy-id...

数据库

8查看

0评论
计算机java 2024-02-18 hadoop HDFS MapReduce

Hadoop三大组件 HDFS、MapReduce、Yarn

Hadoop三大组件见名知意HDFS：分布式文件系统，基本是围绕着这几部分走的Client，NameNode、Secondary NameNode、DateNode。 Client：上传文件时按照Block块大小进行文件的切...

数据库

8查看

0评论

1 2 3 45 6 7 8 9 10 11 12