Hadoop第8周练习—Pig部署及统计访问日志例子

【Hadoop第8周练习—Pig部署及统计访问日志例子】的更多相关文章

Hadoop第8周练习—Pig部署及统计访问日志例子

:搭建Pig环境 :计算每个IP点击次数内容运行环境说明 1.1 硬软件环境线程,主频2.2G,6G内存 l 虚拟软件:VMware® Workstation 9.0.0 build-812388 l 虚拟机操作系统:CentOS 64位,单核,1G内存 l JDK:1.7.0_55 64 bit l Hadoop:1.1.2 1.2 机器网络环境个namenode.2个datanode,其中节点之间可以相互ping通.节点IP地址和主机名分布如下: 序号 IP地…

Hadoop第10周练习—Mahout部署及进行20newsgroup数据分析例子

:搭建Mahout环境 :运行20newsgroup 内容运行环境说明 1.1 硬软件环境线程,主频2.2G,6G内存 l 虚拟软件:VMware® Workstation 9.0.0 build-812388 l 虚拟机操作系统:CentOS 64位,单核,1G内存 l JDK:1.7.0_55 64 bit l Hadoop:1.1.2 1.2 机器网络环境个namenode.2个datanode,其中节点之间可以相互ping通.节点IP地址和主机名分布如下: 序号 IP地址…

linux系统tomcat项目部署和tomcat访问日志

一.只用ip地址访问先把端口号改成80,然后用 <Host name="localhost" appBase="webapps" 137 unpackWARs="true" autoDeploy="true" 138 xmlValidation="false" xmlNamespaceAware="false">…

Hadoop第9周练习—Hive部署测试（含MySql部署）

1.1 2 :搭建Hive环境内容 2.2 3 运行环境说明 1.1 硬软件环境线程,主频2.2G,6G内存 l 虚拟软件:VMware® Workstation 9.0.0 build-812388 l 虚拟机操作系统:CentOS 64位,单核,1G内存 l JDK:1.7.0_55 64 bit l Hadoop:1.1.2 1.2 机器网络环境个namenode.2个datanode,其中节点之间可以相互ping通.节点IP地址和主机名分布如下: 序号 IP地址机器…

Hadoop第3周练习--Hadoop2.X编译安装和实验

作业题目位系统下进行本地编译的安装方式选2 (1) 能否给web监控界面加上安全机制,怎样实现?抓图过程 (2)模拟namenode崩溃,例如将name目录的内容全部删除,然后通过secondary namenode恢复namenode,抓图实验过程 (3) 怎样改变HDFS块大小?实验验证并抓图过程 (4) 把secondary namenode和namenode分离,部署到单独的节点,抓图实验过程 (5) 在Hadoop集群实施成功后,再次格式化名称节点,请问此时datanode还能加入…

Apache Hadoop 2.9.2 完全分布式部署

Apache Hadoop 2.9.2 完全分布式部署(HDFS) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.环境准备 1>.操作平台 [root@node101.yinzhengjie.org.cn ~]# cat /etc/redhat-release CentOS Linux release (Core) [root@node101.yinzhengjie.org.cn ~]# [root@node101.yinzhengjie.org.cn ~]# uname…

3-3 Hadoop集群完全分布式配置部署

Hadoop集群完全分布式配置部署下面的部署步骤,除非说明是在哪个服务器上操作,否则默认为在所有服务器上都要操作.为了方便,使用root用户. 1.准备工作 1.1 centOS6服务器3台手动指定3服务器台以下信息: hostname IP mask gateway DNS 备注 master 172.17.138.82 255.255.255.0 172.17.138.1 202.203.85.88 服务器1 slave1 172.17.138.83 255.255.255.0 172.…

一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）

1)集群规划:主机名 IP 安装的软件运行的进程master 192.168.199.130 jdk.hadoop NameNode.DFSZKFailoverController(zkfc)slaver1 192.168.199.131 jdk.hadoop NameNode.DFSZKFailoverController(…

Hadoop生态圈-通过CDH5.15.1部署spark1.6与spark2.3.0的版本兼容运行

Hadoop生态圈-通过CDH5.15.1部署spark1.6与spark2.3.0的版本兼容运行作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 在我的CDH5.15.1集群中,默认安装的spark是1.6版本,开发的同事跟我抱怨,说之前的大数据平台(在ucloud上,属于云服务)用的就是spark1.6,好多java的API都用不了,有很多高级的功能没法在1.6版本上使用,因此被迫需要升级spark版本,他们要求升级到2.3.0或以上版本,经查阅相关资料,才总结了我部署sp…

Hadoop生态圈-Kafka的完全分布式部署

Hadoop生态圈-Kafka的完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客主要内容就是搭建Kafka完全分布式,它是在kafka本地模式(https://www.cnblogs.com/yinzhengjie/p/9209058.html)的基础之上进一步实现完全分布式搭建过程. 一.试验环境试验环境共计4台服务器 1>.管理服务器(s101) 2>.Kafka节点二(s102,已经部署好了zookeeper服务) 3>.Kafka节点三…