java操作hdfs到数据库或者缓存

使用hadoop工具将数据分析出来以后，须要做入库处理或者存到缓存中。不然就没了意义

一下是使用javaAPI操作hdfs存入缓存的代码：

<span style="font-family:Microsoft YaHei;font-size:14px;">public class InterestToRedisJob {

	FileSystem hdfs = null;

	public InterestToRedisJob(){

		init();

	}

	private void init(){

		Configuration conf = new Configuration();

		conf.set("fs.default.name", "hdfs地址");

		try {

			hdfs = FileSystem.get(conf);

		} catch (IOException e) {

			e.printStackTrace();

		}

	}

	public void ReadFileToReids(String path) throws IOException{

		Path paths = new Path(path);

		FileStatus[] files = hdfs.listStatus(paths);</span>

<span style="font-family:Microsoft YaHei;font-size:14px;"><span style="white-space:pre">		</span>//这儿是自己实现的一个路径顾虑器，也可不适用，在【1】处直接推断part-r-等标示</span>

<span style="font-family:Microsoft YaHei;font-size:14px;">		PathFilter filter = new ResultNameFilter("part-r-");

		Text line = new Text();

		RedisClient redis = new RedisClient();

		for(FileStatus file:files){

			if(file.isDir() || !filter.accept(file.getPath())){//【1】

				continue;

			}else{

				FSDataInputStream input = null;

				try{

					input = hdfs.open(file.getPath());

					LineReader reader = new LineReader(input);

					while(reader.readLine(line) > 0){

						System.out.println(line);

						String[] arr = line.toString().split("\t");</span>

<span style="font-family:Microsoft YaHei;font-size:14px;"><span style="white-space:pre">						</span>//做存入redis处理

						redis.saveHsetValue(arr[0], "interest", arr[1]);

					}

				}catch(Exception e){

					e.printStackTrace();

				}finally{

					if(input != null){

						input.close();

					}

				}

			}

		}

	}

	public static void main(String[] args) {

		InterestToRedisJob job = new InterestToRedisJob();

		try {

			job.ReadFileToReids("你的path");

		} catch (IOException e) {

			e.printStackTrace();

		}

	}

}</span>

上面代码须要改动后使用，请勿直接粘贴。

java操作hdfs到数据库或者缓存的更多相关文章

hadoop集群配置和在windows系统上运用java操作hdfs
安装配置概念 hadoop常用shell命令使用java操作hadoop 本文介绍hadoop集群配置和在windows系统上运用java操作hdfs 安装 http://mirror.bit. ...
hadoop学习（三）HDFS常用命令以及java操作HDFS
一.HDFS的常用命令 1.查看根目录下的信息:./hadoop dfs -ls 2.查看根目录下的in目录中的内容:./hadoop dfs -ls in或者./hadoop dfs -ls ./i ...
java操作hdfs实例
环境:window7+eclipse+vmware虚拟机+搭建好的hadoop环境(master.slave01.slave02) 内容:主要是在windows环境下,利用eclipse如何来操作hd ...
使用java操作HDFS
新建Java Project; 1,右击项目,属性,Java Build Path,Libraries,Add External JARs(haddopp根目录下的所以jar): 2,做一下项目关联, ...
java 操作sqllite的数据库
介绍 sqllite是一个小型数据库,不依赖于数据库服务器,操作它可以像操作本地的文本文件一样.在Android中是用来存储数据到本地的,java中可能也会有用到sqllite需要. 详细 sqlli ...
JAVA 操作 DBF 文件数据库
1.依赖夹包 javadbf-[].4.1.jar jconn3.jar 2.添加属性文件 jdbc.properties jdbc.driverClassName=com.sybase.jdbc3. ...
hadoop3自学入门笔记(3)-java 操作hdfs
1.core-site.xml <configuration> <property> <name>fs.defaultFS</name> <val ...
Java操作HDFS代码样例
代码在GitHub上. 包括如下几种样例代码: 新建文件夹删除文件/文件夹重命名文件/文件夹查看指定路径下的所有文件新建文件读文件写文件下载文件至本地上传本地文件 https://gi ...
JAVA 操作远程mysql数据库实现单表增删改查操作
package MysqlTest; import java.sql.DriverManager; import java.sql.ResultSet; import com.mysql.jdbc.C ...

随机推荐

maven项目如何生成war文件
配置你的pom.xml文件,在你的overview视窗里配置 packaging为 war 然后然后点击 pom.xml右键,run as 选择 install 或是 package如果项目没问题 ...
试用log4jdbc
近日发现一个好东东log4jdbc,他是一个JDBC驱动器,能够记录SQL日志和SQL执行时间等信息.log4jdbc使用SLF4J(Simple Logging Facade For Java)作为 ...
java静态初始化数据
1.通过静态成员变量和静态方法组合(比较单一) public class A{ private static String t=getInit(); private static String get ...
key-value 多线程server的Linux C++实现
项目需求整体思路网络通信字符解析数据存储与查询 1 存储管理 2 数据查询多线程待改进未实现的想法 GitHub源代码项目需求设计一个基于Socket或基于HTTP的server,服务 ...
VS2010+OpenCV2.4.3配置
VS2010+OpenCV2.4.3配置: 环境变量path: D:\openCV2.4.3\opencv\build\x86\vc10\bin 项目-属性-VC++目录:(vs2008中,工具- ...
Git 学习（六）分支管理
Git 学习(六)分支管理几乎每一种版本控制系统都支持分支.使用分支意味着你可以从开发主线上分离开来,然后不影响主线的同时继续工作.在很多版本控制系统中,这是个昂贵的过程,常常需要创建一个源代码目录 ...
iOS:转载：UIControl的使用
主要功能: UIContol(控件是所有控件的基类如:(UIButton)按钮主要用于与用户交互,通常情况下我们不会直接使用UIControl,而是子类化它. 常用属性: BOOL enabled ...
iOS:UIPickerView选择器的使用
通过UIPickerView选择器做的一个类似于密码锁的日期时间表源码如下: #import <UIKit/UIKit.h> @interface ViewController : UI ...
Qt Quick 和qml介绍
很多人不了解Qt Quick和Qml,还有很多人对其存在偏见.这篇文章就是来向这些有困惑的人介绍一下其是什么,有什么特点. 首先,这两个是一个东西吗? 答案:是的.但是,具体来说,Qt Quick是框 ...
windows media server 组件安装后流媒体服务器启动失败
做好的web应用,去客户现场部署的时候发现流媒体服务器不能启动.(现场服务器系统为windows server2008 R2) 自己测试的时候搭建环境没什么问题.从来没有遇到安装windows med ...

java操作hdfs到数据库或者缓存

java操作hdfs到数据库或者缓存的更多相关文章

随机推荐

热门专题