侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

【Hadoop十三】HDFS Java API基本操作

Java  /  管理员 发布于 3年前   291

 

package com.examples.hadoop;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apache.hadoop.fs.FileStatus;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import java.io.BufferedReader;import java.io.InputStreamReader;import java.io.OutputStream;import java.net.URI;import java.text.SimpleDateFormat;import java.util.Date;public class HDFSOp {    private static FileSystem getFileSystem() {        try {            URI uri = new URI("hdfs://hadoop.master:9000/");            Configuration c = new Configuration();            c.setBoolean("dfs.support.append", true);            c.set("dfs.replication", "1");            FileSystem fileSystem = FileSystem.get(uri, c);            return fileSystem;        } catch (Exception e) {            e.printStackTrace();        }        return null;    }    private static boolean exists(FileSystem hdfs, Path file) throws Exception {        return hdfs.exists(file);    }    private static boolean delete(FileSystem hdfs, Path file) throws Exception {        return hdfs.delete(file, true);    }    private static void append(FileSystem hdfs, Path file) throws Exception {        OutputStream os = hdfs.append(file);        String str = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());        os.write(str.getBytes());        os.close();    }    private static void uploadFromLocal(FileSystem hdfs, Path src, Path dst) throws Exception {        hdfs.copyFromLocalFile(src, dst);    }    private static FileStatus[] listFiles(FileSystem hdfs, Path dir) throws Exception {        return hdfs.listStatus(dir);    }    private static String getData(FileSystem hdfs, Path file) throws Exception {        FSDataInputStream is = hdfs.open(file);        BufferedReader br = new BufferedReader(new InputStreamReader(is));        String line;        StringBuilder sb = new StringBuilder();        while ((line = br.readLine()) != null) {            sb.append(line).append(System.lineSeparator());        }        return sb.toString();    }    public static void main(String[] args) throws Exception {        FileSystem hdfs = getFileSystem();        Path src = new Path("file:///D:/people.txt");        Path dst = new Path("/user/hadoop/excercise");        Path dstFile = new Path("/user/hadoop/excercise/people.txt");        //判空,删除        if (exists(hdfs, dstFile)) {            System.out.println("File exists, remove it!!");            delete(hdfs, dstFile);        }        //上传        uploadFromLocal(hdfs, src, dst);        //追加内容        append(hdfs, dstFile);        //列出目录下的所有文件        FileStatus[] files = listFiles(hdfs, dst);        for (FileStatus file : files) {            System.out.println(file.getPath());        }        //文件内容下载        String data = getData(hdfs, dstFile);        System.out.println(data);    }}

 

需要注意的问题:

1. HDFS文件系统权限的问题

如果执行程序的用户没有操作的目录的权限,会报如下异常:AccessControlException,Permission Denied异常,

解决办法是

hdfs dfs -chmod 777 /user/hadoop/excercise

 

2. 关于HDFS append操作

HDFS一开始并不支持append操作,在2.x版本添加了对append操作的支持,但是为了使这个操作成功,需要一些设置,

 

//支持hdfs append操作c.setBoolean("dfs.support.append", true);//因为测试使用的单机环境,必须将dfs.replication设置为1,否则append操作报错。另外只在hdfs-site.xml中设置这个属性还不够c.set("dfs.replication", "1");

 

hdfs-site.xml的配置:

    <property>        <name>dfs.replication</name>        <value>1</value>    </property>    <property>        <name>dfs.support.append</name>        <value>true</value>    </property>

 

dfs.replication给定的属性必须小于等于HDFS中DataNode的数目,即如果是单机模式,这个值只能设置为1,设置的值大于1,那么append操作会报错:

 

java.io.IOException: Failed to replace a bad datanode on the existing pipeline due to no more good datanodes being available to try

 

 

 

 

 

 

 


  • 上一条:
    【HBase十一】Java API操作HBase
    下一条:
    java web项目启动时自动加载自定义properties文件
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • java 正则表达式基础,实例学习资料收集大全 原创(0个评论)
    • java正则表达式彻底研究(0个评论)
    • java正则表达式验证函数(0个评论)
    • MVC、MVP和MVVM分别是什么(0个评论)
    • java 单例模式(饿汉模式与懒汉模式)(0个评论)
    • 近期文章
    • 如何优雅处理async await错误推荐:await-to-js库(0个评论)
    • lodash工具库(0个评论)
    • 在Laravel项目中使用中间件方式统计用户在线时长功能代码示例(0个评论)
    • 在Laravel中构建业务流程模型(0个评论)
    • windows系统中安装FFMpeg及在phpstudy环境php7.3 + php-ffmpeg扩展的使用流程步骤(0个评论)
    • 在go语言中对浮点的数组、切片(slice)进行正向排序和反向排序(0个评论)
    • 在go语言中对整数数组、切片(slice)进行排序和反向排序(0个评论)
    • 在go语言中对字符串数组、切片(slice)进行排序和反向排序(0个评论)
    • 最新国内免注册ChatGPT体验站_ChatGPT镜像站访问链接地址2023/3/28持续更新(0个评论)
    • 在Laravel项目中的实现无密码认证之:发送邮箱链接授权(0个评论)
    • 近期评论
    • 博主 在

      2023年国务院办公厅春节放假通知:1月21日起休7天中评论 @ xiaoB 你只管努力,剩下的叫给天意;天若有情天亦老,..
    • xiaoB 在

      2023年国务院办公厅春节放假通知:1月21日起休7天中评论 会不会春节放假后又阳一次?..
    • BUG4 在

      你翻墙过吗?国内使用vpn翻墙可能会被网警抓,你需了解的事中评论 不是吧?..
    • 博主 在

      go语言+beego框架中获取get,post请求的所有参数中评论 @ t1  直接在router.go文件中配就ok..
    • Jade 在

      如何在MySQL查询中获得当月记录中评论 Dear zongscan.com team, We can skyroc..
    • 2016-11
    • 2018-03
    • 2020-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客