HDFS命令_hadoop集群命令

HDFS命令_hadoop集群命令hdfs常用命令:第一部分:hdfs文件系统命令第一类:文件路径增删改查系列:hdfsdfs-mkdirdir创建文件夹hdfsdfs-rmrdir删除文件夹dirhdfsdfs-ls查看目录文件信息hdfsdfs-lsr递归查看文件目录信息hdfsdfs-statpath返回指定路径的信息第二类:空间大小查看系列命令:hdfsdfs-du-hdir按照适合阅读的形式人性化显示文件大小hdfsdfs-dusuri递归显示目标

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

第一部分:hdfs文件系统命令

权限:
444 r–r–r–
600 drw——-
644 drw-r–r–
666 drw-rw-rw-
700 drwx——
744 drwxr–r–
755 drwxr-xr-x
777 drwxrwxrwx

第一类:文件路径增删改查系列:

hdfs dfs -mkdir dir创建文件夹

hdfs dfs -rmr dir删除文件夹dir

hdfs dfs -ls查看目录文件信息

hdfs dfs -lsr递归查看文件目录信息

hdfs dfs -stat path返回指定路径的信息

第二类:空间大小查看系列命令:

hdfs dfs -du -h dir按照适合阅读的形式人性化显示文件大小

hdfs dfs -dus uri递归显示目标文件的大小

hdfs dfs -du path/file显示目标文件file的大小

第三类:权限管理类:

hdfs dfs -chgrp [group] path改变文件所属组

hdfs dfs -chgrp -R [group] /dir递归更改dir目录的所属组

hdfs dfs -chmod [-R] 权限 -path改变文件的权限

hdfs dfs -chown [owner] /dir改变文件的所有者

hdfs dfs -chown -R [owner] /dir递归更改dir目录的所属用户

第四类:文件操作(上传下载复制)系列:

hdfs dfs -touchz a.txt创建长度为0的空文件a.txt

hdfs dfs -rm file删除文件file

hdfs dfs -put file dir向dir文件上传file文件

hdfs dfs -put filea dir/fileb向dir上传文件filea并且把filea改名为fileb

hdfs dfs -get file dir下载file到本地文件夹

hdfs dfs -getmerge hdfs://Master:9000/data/SogouResult.txt CombinedResult把hdfs里面的多个文件合并成一个文件,合并后文件位于本地系统

hdfs dfs -cat file查看文件file

“`hdfs fs -text /dir/a.txt `如果文件是文本格式,相当于cat,如果文件是压缩格式,则会先解压,再查看

hdfs fs -tail /dir/a.txt查看dir目录下面a.txt文件的最后1000字节

hdfs dfs -copyFromLocal localsrc path从本地复制文件

hdfs dfs -copyToLocal /hdfs/a.txt /local/a.txt从hdfs拷贝到本地

hdfs dfs -copyFromLocal /dir/source /dir/target把文件从原路径拷贝到目标路径

hdfs dfs -mv /path/a.txt /path/b.txt把文件从a目录移动到b目录,可用于回收站恢复文件

第五类:判断系列:

hdfs fs -test -e /dir/a.txt判断文件是否存在,正0负1

hdfs fs -test -d /dir判断dir是否为目录,正0负1

hdfs fs -test -z /dir/a.txt判断文件是否为空,正0负1

第六类:系统功能管理类:

hdfs dfs -expunge清空回收站

hdfs dfsadmin -safemode enter进入安全模式

hdfs dfsadmin -sfaemode leave离开安全模式

hdfs dfsadmin -decommission datanodename关闭某个datanode节点

hdfs dfsadmin -finalizeUpgrade终结升级操作

hdfs dfsadmin -upgradeProcess status查看升级操作状态

hdfs version查看hdfs版本

hdfs daemonlog -getlevel <host:port> <name>打印运行在host:port的守护进程的日志级别

hdfs daemonlog -setlevel <host:port> <name> <level>设置运行在host:port的守护进程的日志级别

hdfs dfs -setrep -w 副本数 -R path设置文件的副本数

第二部分:运维命令

start-dfs.sh启动namenode,datanode,启动文件系统

“`stop-dfs.sh“ ` 关闭文件系统

start-yarn.sh启动resourcemanager,nodemanager

stop-yarn.sh关闭resourcemanager,nodemanager

start-all.sh启动hdfs,yarn

stop-all.sh关闭hdfs,yarn

hdfs-daemon.sh start datanode单独启动datanode

“`start-balancer.sh -t 10%` “启动负载均衡,尽量不要在namenode节点使用

hdfs namenode -format格式化文件系统

hdfs namenode -upgrade分发新的hdfs版本之后,namenode应以upgrade选项启动

“`hdfs namenode -rollback` “ 将namenode回滚到前一版本,这个选项要在停止集群,分发老的hdfs版本之后执行

hdfs namenode -finalizefinalize会删除文件系统的前一状态。最近的升级会被持久化,rollback选项将再不可用,升级终结操作之后,它会停掉namenode,分发老的hdfs版本后使用

hdfs namenode importCheckpoint从检查点目录装载镜像并保存到当前检查点目录,检查点目录由fs.checkpoint.dir指定

第三部分:mapreduce命令

hdfs jar file.jar执行jar包程序

hdfs job -kill job_201005310937_0053杀死正在执行的jar包程序

hdfs job -submit <job-file>提交作业

hdfs job -status <job-id>打印map和reduce完成百分比和所有计数器。

hdfs job -counter <job-id> <group-name> <counter-name>打印计数器的值。

hdfs job -kill <job-id>杀死指定作业。

hdfs job -events <job-id> <from-event-#> <#-of-events>打印给定范围内jobtracker接收到的事件细节。

hdfs job -history [all] <jobOutputDir>

hdfs job -history <jobOutputDir>打印作业的细节、失败及被杀死原因的细节。更多的关于一个作业的细节比如成功的任务,做过的任务尝试等信息可以通过指定[all]选项查看。

hdfs job -list [all]显示所有作业。-list只显示将要完成的作业。

hdfs job -kill -task <task-id>杀死任务。被杀死的任务不会不利于失败尝试。

hdfs job -fail -task <task-id>使任务失败。被失败的任务会对失败尝试不利。

第四部分:hdfs系统检查工具fsck

hdfs fsck <path> -move移动受损文件到/lost+found

“`hdfs fsck -delete
` 删除受损文件。

hdfs fsck <path> -openforwrite打印出写打开的文件。

“`hdfs fsck -files
` 打印出正被检查的文件。

hdfs fsck <path> -blocks打印出块信息报告。

hdfs fsck <path> -locations打印出每个块的位置信息。

hdfs fsck <path> -racks打印出data-node的网络拓扑结构。

第五部分:运行pipies作业

hdfs pipes -conf <path>作业的配置

hdfs pipes -jobconf <key=value>, <key=value>,...增加/覆盖作业的配置项

hdfs pipes -input <path>输入目录

hdfs pipes -output <path>输出目录

hdfs pipes -jar <jar file>Jar文件名

hdfs pipes -inputformat <class>InputFormat类

hdfs pipes -map <class>Java Map类

hdfs pipes -partitioner <class>Java Partitioner

hdfs pipes -reduce <class>Java Reduce类

hdfs pipes -writer <class>Java RecordWriter

hdfs pipes -program <executable>可执行程序的URI

hdfs pipes -reduces <num>reduce个数

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/185700.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • Linux中 rwx含义,linux中rwx

    Linux中 rwx含义,linux中rwx弹性云服务器ECS弹性云服务器(ElasticCloudServer)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率三年低至5折,多种配置可选了解详情认证鉴权||https://support.huaweicloud.com/api-ecs/ecs_01_0013.html,如何使用华为云提供的CentOS-Alt…

  • MySQL数据库基础知识_Mysql教程

    MySQL数据库基础知识_Mysql教程一、数据库基础知识在任何一个关系数据库中,第一范式是对关系模式的基本要求,不满足第一范式的数据库就不是关系数据库第二范式定义:若关系模式R∈1NFR\in1NF,且关系模式R的每个非主属性完全函数依赖于码(候选码),则R∈2NFR\in2NF第三范式定义:在2NF基础上,若一个关系模式中所有非主属性完全依赖于码并且不传递依赖于码,则R∈3NFR\in3NFBC范式定义:设关系模式R(U,F)

  • FDD还是TDD?

    FDD还是TDD?达到更高频谱利用率、覆盖率,同时保证多媒体应用的QoS服务质量,已经成为第四代蜂窝4G网络的挑战和目标。在4G系统里,有许多关于物理层和多接入以提高频谱利用率方面的研究,以支持高达100Mbps甚至更高的数据传输速率。例如,正交频分多址OFDMA、MIMO天线,以及跨层资源优化,被认为是4G系统中的核心技术,并同时在频率选择的衰落信道中提供高可靠通信。另一方面,4G系统双工方式的选择,是FDD

  • ThreadLocal底层原理「建议收藏」

    ThreadLocal底层原理「建议收藏」ThreadLocal作用:提供线程内的局部变量,不同的线程之间不会相互干扰,这种变量在线程的生命周期内起作用,减少同一个线程内多个函数或组件之间一些公共变量传递的复杂性。package com.mupack;public class App{ private String content; public void setContent(String content) { this.content = content; } public Stri

  • ORACLE新增主键问题【CREATE PRIMARY KEY AFTER CREATED A TABLE】

    ORACLE新增主键问题【CREATE PRIMARY KEY AFTER CREATED A TABLE】

  • java divide_java中awt做什么的

    java divide_java中awt做什么的gridx,gridy:设置组件的位置,从0开始gridx设置为GridBagConstraints.RELATIVE代表此组件位于之前所加入组件的右边。gridy设置为GridBagConstraints.RELATIVE代表此组件位于以前所加入组件的下面。建议定义出gridx,gri…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号