1.通过修改实例模板程序来实现自己的map-reduce: 为了让示例程序run起来: 1)安装eclipse 2)安装map-reduce的eclipse插件 eclipse的map-reduce插件可以很方便的创建hadoop项目(自动导入所依赖的map-reduce jar包)和打开map-reduce视图(在里面可以像查看本机文件系统一样直观的看到hdfs文件系统的结构) 安装详细步骤: i)查找eclipse的安装路径: $:whereis eclipse 1.通过修改实例模板程序来实…
看这篇文章请出去跑两圈,然后泡一壶茶,边喝茶,边看,看完你就对hadoop整体有所了解了. Hadoop简介 Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,Mahout,flume等. 这里详细分解这里面的概念让大家通过这篇文章了解到底是什么hadoop: 1.什么是Map/Reduce,看…
最近做的项目,由于预算有限,公司决定不采购Windows服务器,而采购基于Linux的服务器. 一般的VPS服务器,如果使用Windows系统,那么Windows Server2012\2016安装好后,就占用1GB的内存了:只要运行起来,2G的内存就用掉了:装上SqlServer.跑个.net,4G内存是标配,用户数量稍微多些4G内存也捉襟见肘了:分配2个VCpu,在桌面状态下不运行任何程序,每个核心的占用率在15%~20%左右. 大家知道64位的CentOS7装好后内存占用是多少吗,用fre…
在Ubuntu下部署asp.net运行环境,网上教程很多,基本都是编译Mono源码,然后安装jexus.但是可能是我最近RP不太好,编译Mono源码一直都是失败,无奈之下只好找另外的方法安装了. 网上也说如果源码编译失败可以通过如下命令安装默认版本的Mono: 1: sudo apt-get install mono-complete .csharpcode, .csharpcode pre { font-size: small; color: black; font-family: conso…
阿里接到一个电话说练习和比赛智能二选一, 真的很伤心, 练习之前积极老龄化的权利. 要总结ODPS下一个 写map / reduce 并进行购买预测过程. 首先这里的hadoop输入输出都是表的形式, 我们须要一张输入表和一张输出表. 输入表为 提供的 t_alibaba_bigdata_user_brand_total_1  输出表为自己定义的wc_out wc_out 须要预先定义.  以下的实例的功能是合并用户对商品的操作并记录反复次数, 创建的wc_out表结构为: create tab…
在上一篇博客:hadoop入门级总结一:HDFS中,简单的介绍了hadoop分布式文件系统HDFS的整体框架及文件写入读出机制.接下来,简要的总结一下hadoop的另外一大关键技术之一分布式计算框架:Map/Reduce. 一.Map/Reduce是什么: Map/Reduce是在2004年谷歌的一篇论文中提出大数据并行编程框架,由两个基本的步骤Map(映射)和Reduce(化简)组成,Map/Reduce由此得名.同时,由于它隐藏了分布式计算中并行化.容错.数据分布.负载均衡等内部细节,实际的…
前提:安装python,我用的2.7.8版本,并在环境变量path里设置;E:\Python1.解压setuptools(Python包管理工具),cmd到目录执行python setup.py install2.解压pip (在线安装和管理Python包的工具),cmd到目录执行python setup.py install3.再切换到E:\Python\Scripts 目录下cmd输入:easy_install pip4.安装selenium,切到E:\Python\Scripts 下cmd…
插件下载地址:http://download.jboss.org/drools/release/ 1.点开对应的版本文件,选择标红的两个压缩包下载,其他的如有需要也可以自行选择: 2.将下载的压缩包解压,这边放到了E:\tools\drools目录下,打开eclipse,Help->Install New SoftWare->add,选择 E:/tools/drools/droolsjbpm-tools-distribution-5.6.0.Final/binaries/org.drools.…
无意中在网上看到NodeJS的文章,发现最近还挺火的,正好我也是做技术的,那就下载个玩玩呗,试试它的魅力,也来亲自感受下. 网上nodejs的环境的搭建到处都是,我这里就不说了,今天我想通过我自己的环境来说明下nodejs的绿色环境的搭建.甚至拷贝到U盘,可以在任何Windows机器上运行的环境.呵呵,说的有点夸张了,但应该可以在大部分电脑上运行. 什么是node的绿色环境搭建呢?就是我创建一个bat文件,在文件中写入必要的代码,然后双击运行出现的cmd窗口就是我的node运行环境,所有的程序也…
DDlog is a bottom-up, incremental, in-memory, typed Datalog engine. It is well suited for writing programs that incrementally update their output in response to input changes DDlog是一种自底向上,增量式,基于内存的类型化Datalog引擎,它非常适合编写响应输入更改而增量更新其输出的程序.目前官方说明文档介绍的安装方式…