Hadoop Java API 操作 hdfs--1
Hadoop文件系统是一个抽象的概念,hdfs仅仅是Hadoop文件系统的其中之一。
就hdfs而言,访问该文件系统有两种方式:(1)利用hdfs自带的命令行方式,此方法类似linux下面的shell命令;(2)利用hdfs的java接口,通过编写java程序来实现。
操作环境:hadoop-1.0.4,java1.7.0_65,Ubuntu 14.04.1 LTS
import java.io.InputStream;
import java.net.URI; import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils; public class FileSystemCat { public static void main(String[] args) throws Exception {
String uri = args[0];
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(uri), conf);
InputStream in = null;
try {
in = fs.open(new Path(uri));
IOUtils.copyBytes(in, System.out, 4096, false);
} finally {
IOUtils.closeStream(in);
}
} }
气死我了,这个程序都还没运行成功。
一开始,搞不清楚到底需要import那些类, 关于代码中的类需要import哪些package,可以查这个API文档:http://hadoop.apache.org/docs/current/api/index.html
现在能javac编译成功了,但用hadoop filename 还是不能运行,报错提示:
hadoop FileSystemCat hdfs://conf.sh
Error: Could not find or load main class FileSystemCat
气死我了!!!!!!!!!!!!!!!!!!!!!!1
-----------------------------------
我想一定是关于java程序运行,以及classpath的问题,,,,,我需要搞清楚!21:28:54 2014-10-23
------------------------------
问题搞定了,hadoop-env.sh这个文件里面有个CLASSPATH的参数设置,这个设置值要和javac编译生成的.class文件一致 2014-10-23 23:59:53
今天发现,在没有启动hadoop的情况下,居然可以直接启动hbase 2014-10-28 11:12:29
用javac FileSystemCat.java时,会出现很多报错,
stu@master:~$ javac FileSystemCat.java
FileSystemCat.java:4: error: package org.apache.hadoop.conf does not exist
import org.apache.hadoop.conf.Configuration;
^
FileSystemCat.java:5: error: package org.apache.hadoop.fs does not exist
import org.apache.hadoop.fs.FSDataInputStream;
^
FileSystemCat.java:6: error: package org.apache.hadoop.fs does not exist
import org.apache.hadoop.fs.FileSystem;
^
FileSystemCat.java:7: error: package org.apache.hadoop.fs does not exist
import org.apache.hadoop.fs.Path;
^
FileSystemCat.java:8: error: package org.apache.hadoop.io does not exist
import org.apache.hadoop.io.IOUtils;
^
FileSystemCat.java:17: error: cannot find symbol
Configuration conf = new Configuration();
^
symbol: class Configuration
location: class FileSystemCat
FileSystemCat.java:17: error: cannot find symbol
Configuration conf = new Configuration();
^
symbol: class Configuration
location: class FileSystemCat
FileSystemCat.java:18: error: cannot find symbol
FileSystem fs = FileSystem.get(URI.create(uri), conf);
^
symbol: class FileSystem
location: class FileSystemCat
FileSystemCat.java:18: error: cannot find symbol
FileSystem fs = FileSystem.get(URI.create(uri), conf);
^
symbol: variable FileSystem
location: class FileSystemCat
FileSystemCat.java:21: error: cannot find symbol
in = fs.open(new Path(uri));
^
symbol: class Path
location: class FileSystemCat
FileSystemCat.java:22: error: cannot find symbol
IOUtils.copyBytes(in, System.out, 4096, false);
^
symbol: variable IOUtils
location: class FileSystemCat
FileSystemCat.java:24: error: cannot find symbol
IOUtils.closeStream(in);
^
symbol: variable IOUtils
location: class FileSystemCat
12 errors
stu@master:~$
这时需要在编译的时候,把hadoop里面的相应jar文件设置为classpath参数,即如下就对了:
stu@master:~$ javac -classpath /home/stu/hadoop-1.0.4/hadoop-core-1.0.4.jar FileSystemCat.java
然后把生成的FileSystemCat.java复制到 hadoop-env.sh里面设定的文件夹下即可。
# Extra Java CLASSPATH elements. Optional.
export HADOOP_CLASSPATH=/home/stu/myclass
Hadoop Java API 操作 hdfs--1的更多相关文章
- Hadoop Java API操作HDFS文件系统(Mac)
1.下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 2.关联jar包 在 ...
- 使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
- 使用Java Api 操作HDFS
如题 我就是一个标题党 就是使用JavaApi操作HDFS,使用的是MAVEN,操作的环境是Linux 首先要配置好Maven环境,我使用的是已经有的仓库,如果你下载的jar包 速度慢,可以改变Ma ...
- hadoop学习笔记(五):java api 操作hdfs
HDFS的Java访问接口 1)org.apache.hadoop.fs.FileSystem 是一个通用的文件系统API,提供了不同文件系统的统一访问方式. 2)org.apache.hadoop. ...
- 使用java api操作HDFS文件
实现的代码如下: import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import ...
- Hadoop之HDFS(三)HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
- HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...
- JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
- hadoop的API对HDFS上的文件访问
这篇文章主要介绍了使用hadoop的API对HDFS上的文件访问,其中包括上传文件到HDFS上.从HDFS上下载文件和删除HDFS上的文件,需要的朋友可以参考下hdfs文件操作操作示例,包括上传文件到 ...
随机推荐
- Tomcat 日志文件分割
新到公司, 拿到了前辈们留下的 程序 “病历书” , 上面记载了项目上的一些 经常会犯的毛病, 还有相应的解决方法. 其中有的是因为后台 代码逻辑上的一些原因 , N手代码通病了吧 (这个还是以后再 ...
- PR视频剪辑
PR视频剪辑 新手问题1: 将素材导入到Adobe Premiere Pro CC后为什么无法拖入到时间轴上 解决办法:没有建立有序列所致,CC不会一开始就让你新建序列,图中间处写的好清楚“无序列”. ...
- Python项目读取配置的几种方式
1. 将配置写在Python文件中 配置文件(config.py 或 settings.py) 通常放置在程序源代码的目录,方便引用 配置文件 # settings.py class Config(o ...
- NOI-OJ 1.12 ID:10 素数对
整体思路 本题涉及大量素数的使用,故使用埃拉拖色尼算法提前计算出素数表可以避免大量.重复的计算. 判断素数对很简单,使用两个变量p1和p2代表素数表中的第一个和第二个素数,依次在表中向后移动,判断p2 ...
- 第八节: EF的性能篇(一) 之 EF自有方法的性能测试
一. 开发中常见的性能问题 我们在日常开发过程中,由于一些不好的习惯,经常会导致所写的代码性能低下,却毫无发觉,下面就总结一下常见的一些性能问题. 1. 真假分页 ① 假分页: db.xxx.toLi ...
- [物理学与PDEs]第5章第2节 变形的描述, 应变张量 2.1 变形梯度张量
$$\bex \rd{\bf y}={\bf F}\rd {\bf x}, \eex$$ 其中 ${\bf F}=\n_x{\bf y}=\sex{\cfrac{\p y_i}{\p x_j}}$ 为 ...
- 412 6个题 BOM and DOM 定义计数器 网页跳转 网页前进后退
AM BOM-JavaScript: 提供一系列对象哟用于和浏览器窗口交互,对象主要有 window.document.location.navigator.screen 统称浏览器对象模型(Brow ...
- 高性能JS(读书札记)
第一章:加载和执行 1.1脚本位置 将js脚本放在body底部 1.2组织脚本 文件合并,减少http请求(打包工具) 1.3无阻塞的脚本 js倾向于阻止浏览器的某些处理过程,如http请求和用户界面 ...
- NBIOT经典回答【转】
转自:https://blog.csdn.net/pan0755/article/details/70145936 该部分分享的是物联网各垂直应用领域里,NB-IoT技术的部署,看看适合NB-IoT技 ...
- JMeter学习笔记02-基础介绍
基本构成 1)负载发生器:产生负载,多线程模拟用户行为 2)用户运行期:脚本运行引擎,用户运行器附加在线程上,根据指定脚本模拟指定的用户行为 3)资源发生器:生成测试过程中服务器.负载机的资源数据 4 ...