java如何获取hdfs文件大小 hdfs java上传文件_mob64ca14079fb3的技术博客_

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

痴情的红薯 · 使用大型CLOB从C#调用存储过程的问题-腾 ...· 5 月前 ·

好帅的大蒜 · Elasticsearch-桶聚合查询详解_ ...· 8 月前 ·

暗恋学妹的火柴 · java io系列14之 ...· 11 月前 ·

千杯不醉的香烟 · Troubleshoot ...· 1 年前 ·

孤独的领结 · TEM图像分析处理软件DigitalMicr ...· 1 年前 ·

1.HDFS的Java基本操作非常重要

2.Haoop的常用shell操作

1.hadoop fs -ls hdfs://haoop1:8020/目录

java如何获取hdfs文件大小 hdfs java上传文件_Hadoop

2.hadoop fs -copyFromLocal|put 文件地址目的目录

java如何获取hdfs文件大小 hdfs java上传文件_Hadoop_02

3.hadoop fs -copyToLocal|get 文件地址目的目录

4.hadoop fs -moveToLocal 文件地址目地址

5.hadoop fs -mkdir 创建文件夹

6.hadoop fs -rm -r -skipTrash 目标文件夹或文件（不在回收站中保留）

3.HDFS的基本操作
1）构造一个hdfs的客户端(可指定URI和user，如指定，则可省略第二步)
FileSystem
例子：FileSystem fs = FileSystem.get(new URI("hdfs://hadoop1:8020"),new Configuration(),"用户名")
2)构造一个配置参数封装对象
Configuration 默认的fs.defaultFS的默认值是file：///指的是本地文件系统URI，我们需要需改
3)执行操作
a) fs.copyFromLocalFile
b) fs.copyToLocalFile(false,XX,XX,true); 第一个参数是否移除hdfs上的文件，第四个参数，是否使用本地文件系统
c）fs.listFiles 查看文件的信息(只能列出文件信息)
d) fs.listStatus 查看文件和文件夹的信息
e) fs.getFileBlockLocations 查看文件块的信息（指定偏移量）
f) fs.concat 连接多个文件
h) fs.getUse 获得整个文件系统的已使用空间
i) fs.rename 文件改名
j) fs.setReplocation 修改文件的副本数量

4)操作完毕后，关闭客户端

4. HDFS的IO流操作

1）fs.open() 获得hdfs文件的输入流拿到FSDataInputStream(随机流，可支持seek方法)

2）IOUtils.copyBytes方法处理流,可指定缓冲流大小记得关闭流！

从指定偏移量读取hdfs中的文件数据，具有重大意义，在分布式数据处理时，可以将数据分片来分配给不同的节点处理

3）fs.create() 获得hdfs上文件的输出流

java如何获取hdfs文件大小 hdfs java上传文件_hadoop_03