hadoop的hdfs中的javaAPI操作

package cn.itcast.bigdata.hdfs;

import java.net.URI;

import java.util.Iterator;

import java.util.Map.Entry;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

/**

 *

 * 客户端去操作hdfs时，是有一个用户身份的

 * 默认情况下，hdfs客户端api会从jvm中获取一个参数来作为自己的用户身份：-DHADOOP_USER_NAME=hadoop

 *

 * 也可以在构造客户端fs对象时，通过参数传递进去

 * @author

 *

 */

public class HdfsClientDemo {

    FileSystem fs = null;

    Configuration conf = null;

    @Before

    public void init() throws Exception{

        conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://master:9000");

        //拿到一个文件系统操作的客户端实例对象

        /*fs = FileSystem.get(conf);*/

        //可以直接传入 uri和用户身份

        fs = FileSystem.get(new URI("hdfs://master:9000"),conf,"hadoop"); //最后一个参数为用户名

    }

    @Test

    public void testUpload() throws Exception {

        Thread.sleep(2000);

        fs.copyFromLocalFile(new Path("G:/access.log"), new Path("/access.log.copy"));

        fs.close();

    }

    @Test

    public void testDownload() throws Exception {

        fs.copyToLocalFile(new Path("/access.log.copy"), new Path("d:/"));

        fs.close();

    }

    @Test

    public void testConf(){

        Iterator<Entry<String, String>> iterator = conf.iterator();

        while (iterator.hasNext()) {

            Entry<String, String> entry = iterator.next();

            System.out.println(entry.getValue() + "--" + entry.getValue());//conf加载的内容

        }

    }

    /**

     * 创建目录

     */

    @Test

    public void makdirTest() throws Exception {

        boolean mkdirs = fs.mkdirs(new Path("/aaa/bbb"));

        System.out.println(mkdirs);

    }

    /**

     * 删除

     */

    @Test

    public void deleteTest() throws Exception{

        boolean delete = fs.delete(new Path("/aaa"), true);//true， 递归删除

        System.out.println(delete);

    }

    @Test

    public void listTest() throws Exception{

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        for (FileStatus fileStatus : listStatus) {

            System.err.println(fileStatus.getPath()+"================="+fileStatus.toString());

        }

        //会递归找到所有的文件

        RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

        while(listFiles.hasNext()){

            LocatedFileStatus next = listFiles.next();

            String name = next.getPath().getName();

            Path path = next.getPath();

            System.out.println(name + "---" + path.toString());

        }

    }

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://master:9000");

        //拿到一个文件系统操作的客户端实例对象

        FileSystem fs = FileSystem.get(conf);

        fs.copyFromLocalFile(new Path("G:/access.log"), new Path("/access.log.copy"));

        fs.close();

    }

}

package cn.itcast.bigdata.hdfs;

import java.net.URI;

import java.util.Iterator;

import java.util.Map.Entry;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

/**

 *

 * 客户端去操作hdfs时，是有一个用户身份的

 * 默认情况下，hdfs客户端api会从jvm中获取一个参数来作为自己的用户身份：-DHADOOP_USER_NAME=hadoop

 *

 * 也可以在构造客户端fs对象时，通过参数传递进去

 * @author

 *

 */

public class HdfsClientDemo {

    FileSystem fs = null;

    Configuration conf = null;

    @Before

    public void init() throws Exception{

        conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://master:9000");

        //拿到一个文件系统操作的客户端实例对象

        /*fs = FileSystem.get(conf);*/

        //可以直接传入 uri和用户身份

        fs = FileSystem.get(new URI("hdfs://master:9000"),conf,"hadoop"); //最后一个参数为用户名

    }

    @Test

    public void testUpload() throws Exception {

        Thread.sleep(2000);

        fs.copyFromLocalFile(new Path("G:/access.log"), new Path("/access.log.copy"));

        fs.close();

    }

    @Test

    public void testDownload() throws Exception {

        fs.copyToLocalFile(new Path("/access.log.copy"), new Path("d:/"));

        fs.close();

    }

    @Test

    public void testConf(){

        Iterator<Entry<String, String>> iterator = conf.iterator();

        while (iterator.hasNext()) {

            Entry<String, String> entry = iterator.next();

            System.out.println(entry.getValue() + "--" + entry.getValue());//conf加载的内容

        }

    }

    /**

     * 创建目录

     */

    @Test

    public void makdirTest() throws Exception {

        boolean mkdirs = fs.mkdirs(new Path("/aaa/bbb"));

        System.out.println(mkdirs);

    }

    /**

     * 删除

     */

    @Test

    public void deleteTest() throws Exception{

        boolean delete = fs.delete(new Path("/aaa"), true);//true， 递归删除

        System.out.println(delete);

    }

    @Test

    public void listTest() throws Exception{

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        for (FileStatus fileStatus : listStatus) {

            System.err.println(fileStatus.getPath()+"================="+fileStatus.toString());

        }

        //会递归找到所有的文件

        RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

        while(listFiles.hasNext()){

            LocatedFileStatus next = listFiles.next();

            String name = next.getPath().getName();

            Path path = next.getPath();

            System.out.println(name + "---" + path.toString());

        }

    }

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://master:9000");

        //拿到一个文件系统操作的客户端实例对象

        FileSystem fs = FileSystem.get(conf);

        fs.copyFromLocalFile(new Path("G:/access.log"), new Path("/access.log.copy"));

        fs.close();

    }

}

hadoop的hdfs中的javaAPI操作的更多相关文章

Hadoop基础-HDFS的API常见操作
Hadoop基础-HDFS的API常见操作作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本文主要是记录一写我在学习HDFS时的一些琐碎的学习笔记, 方便自己以后查看.在调用API ...
HDFS文件系统的JAVA-API操作(一)
使用java.net.URL访问HDFS文件系统 HDFS的API使用说明: 1.如果要访问HDFS,HDFS客户端必须有一份HDFS的配置文件也就是hdfs-site.xml,从而读取Nameno ...
Hadoop学习-hdfs安装及其一些操作
hdfs:分布式文件系统有目录结构,顶层目录是: /,存的是文件,把文件存入hdfs后,会把这个文件进行切块并且进行备份,切块大小和备份的数量有客户决定. 存文件的叫datanode,记录文件的切 ...
Hadoop架构: HDFS中数据块的状态及其切换过程，GS与BGS
该系列总览: Hadoop3.1.1架构体系——设计原理阐述与Client源码图文详解 : 总览首先,我们要提出HDFS存储特点: 1.高容错 2.一个文件被切成块(新版本默认128MB一个块)在不 ...
Hadoop(7)-HDFS客户端的API操作
1 客户端环境准备根据自己电脑的操作系统拷贝对应的编译后的hadoop jar包到非中文路径配置HADOOP_HOME的环境变量,并且在path中配置hadoop的bin 重启电脑 2. Hdfs ...
hadoop的hdfs中的namenode和datanode知识总结
一,NameNode: 1, Namenode是中心服务器,单一节点(简化系统的设计和实现),负责管理文件系统的名称空间(namespace)以及客户端对文件的访问. 2, 文件操作,Namenod ...
HDFS的基本shell操作，hadoop fs操作命令
(1)分布式文件系统随着数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管 ...
[转]HDFS中JAVA API的使用
HDFS是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件.删除文件.读取文件内容等操作.下面记录一下使用JAVA API对HDFS中的文件进行操作的过程. 对分HDFS中的 ...
HDFS中JAVA API的使用
HDFS中JAVA API的使用 HDFS是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件.删除文件.读取文件内容等操作.下面记录一下使用JAVA API对HDFS中的 ...

随机推荐

.net core WebApi Mutex实现并发同步
Mutex,中文译为互斥体,在.net中也是作为一种线程或进程之间的互斥体存在.即在同一时刻,一个共享资源只允许被某一个线程或进程访问,其他线程或进程需要等待(直至获取互斥锁为止). Mutex的使用 ...
private、public、protected和默认
类中的域最好标记为private: 方法最好标记为public: private:仅对本类可见 public:对所有类可见 protected:对本包和对所有子类可见默认(什么都不写):对本包可见 ...
spring开启事务时启动报错SAXParseException
在启动项目时报解析xml文件异常: org.xml.sax.SAXParseException: cvc-complex-type.2.4.c 'aop:config'...... 由报错提示 ...
python中如何删除列表中的所有元素
今天写代码的时候遇到一个小问题,Python中要删除列表中的所有元素.Python本身就提供了pop.remove.del这些删除的函数.我想着用循环实现,结果很麻烦.几番周折上了stackoverf ...
centos 安装桌面系统
yum -y groupinstall "Desktop" "Desktop Platform" "X Window System" &qu ...
centos7 操作防火墙
原文:https://blog.csdn.net/u012498149/article/details/78772058 1.firewalld的基本使用启动: systemctl start fi ...
JDK8源码之Arrays
Arrays是一个工具类,包含了各种数组的操作方法,包括排序.搜索.转化,在JDK1.8中新增了一些方法,对原有一些方法的并发性做了增强,极大地提高了原有方法的性能. 1.rangeCheck(int ...
剖析 GSM 加密机制以及位置更新的过程
你有没有想过打开手机时会发生什么?它是如何以安全的方式与网络进行通信?几乎所有人都知道TCP / IP,并且可能许多人还是专家,但是谈到电信方面,很少有人知道它的内部原理. gsm中的消息结构是什么? ...
Java学习笔记36（jdbc快速入门）
JDBC: Java DataBase Connectivity 是java程序连接存取数据库的应用程序接口 (是sun公司的程序员定义的一套操作数据库的规则,然后下面的各个公司如:mysql,sql ...
9--Python入门--模块
模块简单来说是一个保存了python代码的文件很多python开源库就是模块 #例如我们调用科学计算库 numpy import numpy as np #as np是为了之后方便调用 from pa ...

hadoop的hdfs中的javaAPI操作

hadoop的hdfs中的javaAPI操作的更多相关文章

随机推荐

热门专题