C# Hadoop学习笔记(一)—环境安装
一、安装环境
1,前期准备:官网下载“NuGet Package Manager”,按自己已有的VS环境下载对应版本;
2,利用NuGet下载Hadoop For .NET SDK,地址“http://hadoopsdk.codeplex.com/”
3,安装。
4,通过HDInsight,安装Windows Azure,目前是预览版本。
5,参照网址“http://blogs.msdn.com/b/data_otaku/archive/2013/08/14/hadoop-for-net-developers.aspx” 系统学习API
二、测试DEMO
- using System;
- using System.Collections.Generic;
- using System.Linq;
- using System.Text;
- using System.Threading.Tasks;
- using Microsoft.Hadoop;
- using Microsoft.Hadoop.MapReduce;
- using Microsoft.Hadoop.WebClient.WebHCatClient;
- using System.Diagnostics;
- using System.IO;
- using System.IO.MemoryMappedFiles;
- namespace HadoopConsol
- {
- class Program
- {
- static void Main(string[] args)
- {
- Stopwatch sw = new Stopwatch();
- long hadoopTime=0;
- long normalTime=0;
- sw.Start();
- //start hadoop
- Console.WriteLine(" Hadoop Process Strating ....");
- #region Hadoop time
- #region hadoopconnet
- Console.WriteLine(" Hadoop Connect Strating ....");
- //establish job configuration
- HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
- myConfig.InputPath = "/demo/simple/in";
- myConfig.OutputFolder = "/demo/simple/out";
- //connect to cluster
- Uri myUri = new Uri("http://localhost");
- string userName = "hadoop";
- string passWord = null;
- IHadoop myCluster = Hadoop.Connect(myUri, userName, passWord);
- hadoopTime += sw.ElapsedMilliseconds;
- Console.WriteLine(" Hadoop Connect End.");
- Console.WriteLine(" Hadoop Connect time:" + sw.ElapsedMilliseconds);
- #endregion
- #region hadoopmapreduce
- sw.Reset();
- sw.Start();
- Console.WriteLine(" Hadoop MapReduce Strating ....");
- //execute mapreduce job
- MapReduceResult jobResult =
- myCluster.MapReduceJob.Execute<MySimpleMapper, MySimpleReducer>(myConfig);
- hadoopTime += sw.ElapsedMilliseconds;
- Console.WriteLine(" Hadoop MapReduce End.");
- Console.WriteLine(" Hadoop MapReduce Time:"+sw.ElapsedMilliseconds);
- #endregion
- #region Hadoop End
- sw.Reset();
- sw.Start();
- Console.WriteLine(" Hadoop Endprocess Strating ....");
- //write job result to console
- int exitCode = jobResult.Info.ExitCode;
- string exitStatus = "Failure";
- if (exitCode == 0) exitStatus = "Success";
- exitStatus = exitCode + " (" + exitStatus + ")";
- Console.WriteLine();
- Console.Write("Exit Code = " + exitStatus);
- Console.WriteLine(" Hadoop Endprocess End.");
- hadoopTime += sw.ElapsedMilliseconds;
- Console.WriteLine(" Hadoop Exit Time:" + sw.ElapsedMilliseconds);
- Console.WriteLine(" Hadoop Process All Time:" + hadoopTime);
- #endregion
- #endregion
- #region Normal time
- //start Normal
- Console.WriteLine(" Normal Process Strating ....");
- sw.Reset();
- sw.Start();
- //normal process
- #region Normal Process
- int myevenCount = 0;
- int myeventSum = 0;
- int myoddCount = 0;
- int myoddSum = 0;
- StreamReader fs = new StreamReader(@"c:\TEMP\integers.txt");
- while (fs.Peek() >= 0)
- {
- string strTemp = fs.ReadLine();
- if (Int32.Parse(strTemp) % 2 == 0)
- {
- myevenCount++;
- myeventSum += Int32.Parse(strTemp);
- }
- else
- {
- myoddCount++;
- myoddSum += Int32.Parse(strTemp);
- }
- }
- //MemoryMappedFile m = MemoryMappedFile.
- Console.WriteLine("even:" + "\t" + myevenCount + "\t" + myeventSum);
- Console.WriteLine("odd:" + "\t" + myoddCount + "\t" + myoddSum);
- #endregion
- Console.WriteLine(" Normal Process End.");
- normalTime += sw.ElapsedMilliseconds;
- Console.WriteLine(" Normal Exit Time:" + sw.ElapsedMilliseconds);
- Console.WriteLine(" Normal Process All Time:" + normalTime);
- #endregion
- sw.Stop();
- Console.Read();
- }
- }
- public class MySimpleMapper : MapperBase
- {
- public override void Map(string inputLine, MapperContext context)
- {
- //interpret the incoming line as an integer value
- int value = int.Parse(inputLine);
- //determine whether value is even or odd
- string key = (value % 2 == 0) ? "even" : "odd";
- //output key assignment with value
- context.EmitKeyValue(key, value.ToString());
- }
- }
- public class MySimpleReducer : ReducerCombinerBase
- {
- public override void Reduce(
- string key, IEnumerable<string> values, ReducerCombinerContext context
- )
- {
- //initialize counters
- int myCount = 0;
- int mySum = 0;
- //count and sum incoming values
- foreach (string value in values)
- {
- mySum += int.Parse(value);
- myCount++;
- }
- //output results
- context.EmitKeyValue(key, myCount + "\t" + mySum);
- }
- }
- }
三、测试结果
C# Hadoop学习笔记(一)—环境安装的更多相关文章
- openresty 学习笔记一:环境安装
openresty 学习笔记一:环境安装 openresty 是一个基于 Nginx 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库.第三方模块以及大多数的依赖项.用于方便地搭 ...
- hadoop学习笔记壹 --环境搭建及配置文件的修改
Hadoop生态和其他生态最大的不同之一就是“单一平台多种应用”的理念了. hadoop能解决是什么问题: 1.HDFS :海量数据存储 MapReduce: 海量数据分析 YARN :资源管理调 ...
- appium学习笔记(环境安装配置,设备启动)
Android SDK下载及配置 下载地址 下载后解压缩,打开SDK Manager.exe,下载适当版本的Android包 配置环境变量:目录下的tools路径(含uiautomatorview ...
- Hadoop学习笔记-008-CentOS_6.5_64_yum安装mysql
******************************卸载mysql***************************** 第一步,查看centos上是否已经安装了mysql数据库 # rp ...
- Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...
- Hadoop学习笔记(3)——分布式环境搭建
Hadoop学习笔记(3) ——分布式环境搭建 前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下. 在这里, ...
- Hadoop学习笔记(4) ——搭建开发环境及编写Hello World
Hadoop学习笔记(4) ——搭建开发环境及编写Hello World 整个Hadoop是基于Java开发的,所以要开发Hadoop相应的程序就得用JAVA.在linux下开发JAVA还数eclip ...
- PHP学习笔记----IIS7下安装配置php环境
原文:PHP学习笔记----IIS7下安装配置php环境 Php如何安装 Php版本的选择 Php在windows下的(php5.4.7)有两种版本: VC9 x86 Non Thread Safe ...
- Hadoop学习笔记(10) ——搭建源码学习环境
Hadoop学习笔记(10) ——搭建源码学习环境 上一章中,我们对整个hadoop的目录及源码目录有了一个初步的了解,接下来计划深入学习一下这头神象作品了.但是看代码用什么,难不成gedit?,单步 ...
- Hadoop学习笔记(1) ——菜鸟入门
Hadoop学习笔记(1) ——菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序. ...
随机推荐
- 分形之龙形曲线(Dragon Curve)
龙形曲线(Dragon Curve)又叫分形龙,是一种自相似碎形曲线的统称,因形似龙的蜿蜒盘曲而得名. 一种简单的生成分形龙的方式是:拿着一条细长的纸带,把它朝下的一头拿上来,与上面的一头并到一起.用 ...
- oracle 中top-n的使用
对于ms sqlserver数据库中可以直接使用top(n)提取前N 个结果,而oracle中并不能直接使用的.oracle中提供了对于提取前N 条的结果的方法 那就是用行编号 例如:select ...
- 免 Google Play 的安卓应用下载平台
本文已过时,以后会在我的新博客内更新 https://blog.clso.fun/posts/2019-03-22/non-google-play-apk-download.html 鉴于那啥你懂的原 ...
- 【vue】项目编译报错‘npm ERR! **@**dev: `webpack-dev-server --inline --progress --config ’’
关于npm ERR! **@**dev: `webpack-dev-server --inline --progress --config‘ 原因:这是新版webpack存在的BUG,卸载现有的新版本 ...
- 【计算机网络】 DNS学习笔记 (>﹏<)
参考书籍 <计算机网络-自顶向下> 作者 James F. Kurose DNS的作用 DNS是因特网的目录服务 DNS是因特网的目录服务,它提供了主机名到IP地址映射的查询服务 ...
- springBoot2 基础语法
请求响应 request对象 request 对象其实是HttpServletRequest 类型, 通过它可以获取请求相关的一切信息, 包含请求信息 . 以及请求参数 ,甚至可以当成往里面存储数据[ ...
- 友链&&日记
上面友链,下面日记 友人链 最喜欢galgameの加藤聚聚 初三一本&&\(ACG\)姿势比我还丰厚的yx巨巨 更喜欢galgame的shadowice czx ZigZag胖胖 文文 ...
- TakePhoto实现拍照得到图片和从相册得到图片
在学郭霖大神的第一行代码的时候,学到利用相机拍照和从本地相册取照片的那一小节的时候,代码写出来但是出了很多问题,APP老是崩溃,一番百度最终还是没有找到解决办法 无奈只能用别人现成的轮子了,然后就发现 ...
- 【spring揭秘】1、关于IOC的基础概念
1.基础概念 IOC有三种注入方式: 1.构造方法注入,就是通过构造方法进行实例化成员属性对象,优点是实现对象之后直接就可以使用,但是参数过多也是个麻烦 2.setter方法注入,实现相应的sette ...
- (转)通过 Javacore 诊断线程挂起等性能问题
原文:https://www.ibm.com/developerworks/cn/websphere/library/techarticles/1406_tuzy_javacore/1406_tuzy ...