version
查看Hadoop版本
hdfs dfs versionmkdir
创建HDFS文件系统目录
hdfs dfs -mkdir /user/dirls
类似Linux Shell的ls命令。用它可以列出指定目录下的所有文件。
hdfs dfs -ls -Rput
把本地文件系统文件和目录拷贝到HDFS
hdfs dfs -put /home/dataflair/Desktop/sample /user/dataflair/dir1get
从HDFS下载文件到本地文件系统
hdfs dfs -get /user/dir1 /home把HDFS多个文件合并下载到本地系统的一个文件里面
hdfs dfs -getmerge /user/dir1/sample.txt /user/dir2/sample2.txt /home/sample1.txtcat
在控制台现实文件内容
hdfs dfs -cat /user/dir1/sample.txtmv
把文件移动到目标路径
hdfs dfs -mv /user/dir1/sample.txt /user/dir2cp
把文件或者目录拷贝到指定路径下
hdfs dfs -cp /user/dataflair/dir2/sample.txt /user/dataflair/dir1tail
在控制台现实文件最后1KB的数据
hdfs dfs -tail /user/dataflair/dir2/purchases.txt
hdfs dfs -tail -f /user/dataflair/dir2/purchases.txt提示
-f 参数可以实时查看文件的变化
rm
删除文件和目录,删除目录时需要加r参数
hdfs dfs -rm /tmp/tmp20240813
# rm: `/tmp/tmp20240813': Is a directory
hdfs dfs -rm -r /tmp/tmp20240813expunge
清空回收站
hdfs dfs -expungechown
改变文件的拥有者。使用-R将改变在目录结果下递归进行。命令的使用者必须是超级用户。
hdfs dfs -chown -R dataflair /opt/hadoop/logschmod
改变文件的权限。使用-R将使改变在目录结构下递归进行。命令的使用者必须是超级用户。
hdfs dfs -chmod 777 /user/dataflair/dir1/samplesetrep
改变一个文件的副本系数。-R选项用于递归改变目录下所有文件的副本数
hdfs dfs -setrep -w 3 /user/dataflair/dir1df
展示 Hadoop 文件系统可用空间。
hdfs dfs -df -htouchz
创建一个0字节的空文件。
hdfs dfs -touchz /user/dataflair/dir2test
用于文件检测操作,如果路径存在,返回 1,如果是目录返回 0。
提示
-e 检查文件是否存在。如果存在则返回0。
-z 检查文件是否是0字节。如果是则返回0。
-d 如果路径是个目录,则返回1,否则返回0。
hdfs dfs -test -e sample
hdfs dfs -test -z sample
hdfs dfs -test -d sampletext
将源文件输出为文本格式。允许的格式是 zip 和 TextRecordInputStream。
hdfs dfs -text /user/dataflair/dir1/samplestat
返回指定路径统计信息
hdfs dfs -stat /user/dataflair/dir1appendToFile
追加一个文件到已经存在的文件末尾
hadoop fs -appendToFile /home/dataflair/Desktop/sample /user/dataflair/dir1checksum
返回文件的校验和信息。
hadoop fs -checksum /user/dataflair/dir1/samplecount
统计一个指定目录下的文件结点数量。
$ hadoop fs -count /testelephant
2 1 108 testelephant提示
第一个数值 2 表示 /testelephant 下的文件夹的个数,
第二个数值 1 表是当前文件夹下文件的个数,
第三个数值 108 表示该文件夹下文件所占的空间大小,这个大小是不计算副本的个数的,单位是字节(byte)。
$ hadoop fs -count -q /sunwg
1024 1021 10240 10132 2 1 108 /testelephant提示
在 count 后面增加 -q 选项可以查看当前文件夹的限额使用情况。
第一个数值 1024 ,表示总的文件包括文件夹的限额。
第二个数值 1021 ,表示目前剩余的文件限额,即还可以创建这么多的文件或文件夹。
第三个数值 10240 ,表示当前文件夹空间的限额。
第四个数值 10132 ,表示当前文件夹可用空间的大小,这个限额是会计算多个副本的。
剩下的三个数值与 -count 的结果一样。
find
找出能匹配上的所有文件。
hadoop fs -find /user/dataflair/dir1/ -name sample -print提示
-name pattern 不区分大小写,对大小写不敏感。
-iname pattern 对大小写敏感。
-print 打印。
-print0 打印在一行。