1. 前提是hadoop集群已经配置完成并且可以正常启动:以下是我的配置方案: 首先配置vim /etc/hosts 192.168.1.64 xuegod64 192.168.1.65 xuegod65 192.168.1.63 xuegod63 (将配置好的文件拷贝到其他两台机器,我是在xuegod64上配置的,使用scp /etc/hosts xuegod63:/etc/进行拷贝,进行该步骤前提是已经配置好SSH免密码登录:关于SSH免密码登录在此就不再详说了) 2.准备安装包如下图 [h…
一.Pig简介和Pig的安装配置 1.最早是由Yahoo开发,后来给了Apache 2.支持语言:PigLatin 类似SQL 3.翻译器 PigLatin ---> MapReduce(Spark) 4.安装和配置 (1)tar -zxvf pig-0.17.0.tar.gz -C ~/training/ (2)设置环境变量 vi ~/.bash_profile PIG_HOME=/root/training/pig-0.17.0 export PIG_HOME PATH=$PIG_HOME/…
inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish ).(来源:http://blog.csdn.net/inkfish) Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0.Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-like语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运…
一.下载 在百度上搜索"mysql-5.6.24-winx64下载" 二.安装 选择安装路径,我的路径“C:\Soft\mysql-5.6.24-winx64” 三.环境配置 计算机->属性->高级系统设置->环境变量 1.环境变量中的“path”,加入“ 在path值开头处输入:(记住输入的地方有分号,为英文的分号) C:\program files\mysql\bin; 四.密码忘记的解决 可以参考http://jingyan.baidu.com/article/…
Pig可以看做是Hadoop的客户端软件,使用Pig Latin语言可以实现排序.过滤.求和.分组等操作. Pig的安装步骤: 一.去Pig的官方网站下载.http://pig.apache.org/releases.html#14+April%2C+2014%3A+release+0.12.1+available 这里我选择的是14 October, 2013: release 0.12.0 available 这个版本.将pig-0.12.0.tar.gz 下载到本地中. 二.将Pig放在了…
云主机我使用的是青云的,还有好多其他品牌,比如阿里云 unitedstack 等等. 注册完青云后,会有试用券发到账户,可以利用此券试用其服务. 1 首先创建好一个主机,按照提示选择好系统,创建好一个linux 主机: 2 创建公网IP 将公网IP配置到主机即可. 到此为止,linux的系统就搭建好了.接下来我们要为云主机安装jdk,具体步骤如下: 控制台输入命令javac 显示有可以安装的jdk, 这里选择一个openjdk-7-jdk 安装,安装命令为apt-get install open…
hadoop安装 进入Xftp将hadoop-2.7.3.tar.gz 复制到自己的虚拟机系统下的放软件的地方,我的是/soft/software 在虚拟机系统装软件文件里,进行解压缩并重命名 进入profile.d进入hadoop环境变量配置 配置环境并使之成为全局变量.保存,export 使其生效 查看hadoop版本看是否安装成功 hadoop配置 进入notepad++连接自己的系统,打开目录,进入文件进行添加信息(添加信息从window下解压文件里,再解压hadoop-2.7.3\sh…
转自:http://www.iteblog.com/archives/992 Hadoop经常用于处理大量的数据,如果期间的输出数据.中间数据能压缩存储,对系统的I/O性能会有提升.综合考虑压缩.解压速度.是否支持split,目前lzo是最好的选择.LZO(LZO是Lempel-Ziv-Oberhumer的缩写)是一种高压缩比和解压速度极快的编码,它的特点是解压缩速度非常快,无损压缩,压缩后的数据能准确还原,lzo是基于block分块的,允许数据被分解成chunk,能够被并行的解压.LZO库实现…
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构. 对于Hadoop的集群来讲,可以分成两大类角色:Master和Salve.一个HDFS集群是由一个NameNode和若干个DataNode组成的.其中Nam…
安装前的准备 1. 准备4台机器.或虚拟机 4台机器的名称和IP对应如下 master:192.168.199.128 slave1:192.168.199.129 slave2:192.168.199.130 slave3:192.168.199.131 2.分别为4台机器安装JDK8 步骤详细请参考: CentOS7卸载 OpenJDK 安装Sun的JDK8   3.为4台机器配置host name 192.168.199.128配置hostname为master 192.168.199.1…