1.概述

  本课程的视频教程地址:《Hadoop 回顾

  好的,下面就开始本篇教程的内容分享,本篇教程我为大家介绍我们要做一个什么样的Hadoop项目,并且对Hadoop项目的基本特点和其中的难点做有针对性的剖析,完成项目环境的基本配置,以及项目工程和Hadoop插件的相关准备等工作。

  本课程主要包含以下课时,其内容如下图所示:

  本节为大家分享的是第一节——《Hadoop 回顾》,下面开始今天的分享内容。

2.内容

  从这节开始,我们将进入到Hadoop项目的实战学习,本节课程为大家介绍的主要知识点有一下内容,如下图所示:

  首先,我们来看看本节的Hadoop的业务知识点,业务场景如下:

  假设现在有以下场景,用户每天都会对某网站进行点击,这些点击都会记录到日志中,然后分析用户在网站的使用习惯。

  其内容包含如下内容,如下图所示:

  接着,是Hadoop的应用场景,其内容包含如下内容,如下图所示:

  通过阅读上图,下面我给大家解释以下这个图中所设计的含义:

  1.Hadoop的核心之一,就是它的离线计算模型MapReduce。

  • 在数据统计中,统计网站的PV、UV
  • 大规模Web信息搜索
  • 一些复杂的算法

  MapReduce都能非常友好的实现。

  2.海量数据的离线分析
  在MapReduce框架下,很难处理实时计算,作业都以日志分析这样的离线作业为主。

  3.静态数据源
  Hadoop要保证分析与计算的数据源是静态的,不能是实时的流水数据。这也是Hadoop自身设计特点决定了数据源必须是静态的。

  在了解了Hadoop的应用场景和业务场景之后,下面我们来看看用户行为分析平台的搭建需要注意哪些事项,注意事项包含以下内容,如下图所示:
 

  1.平台的高可用性  

  如图所示,这是一个高可用平台的简要说明图,在Hadoop2.x版本后,Hadoop提出了HA方案。HA方案的出现,解决了第一代的单点问题,在图中,我们可以看出,在Client请求服务时,若NameNode Active(NNA)节点宕机,整个集群依然是可用的,NameNode Standby(简称NNS)节点会立马切换自己的状态,由Standby切换为Active,并对外提供服务。保证集群的高可用性。

  注:下面是集群的启动演示,可以参考视频的启动步骤:《Hadoop 回顾
  2.在对NameNode Active节点和NameNode Standby节点配置时
  hdfs-site.xml和core-site.xml两个文件中HDFS的NameService要保持一致;
在配置HA的实现时,Hadoop官方提供了两种NameNode HA的实现方式,分别是QJM和NFS,同学们可自选一种实现。
  3.在配置YARN的相关配置文件
  yarn-site.xml文件,有一个属性需要特别注意,它就是yarn.resourcemanager.ha.id这个属性。假设,我们在NNA节点上配置的是value值是rm1,那么在NNS节点上我们得将value换成rm2。

  4.在集群启动时,需注意按照以下顺序
  第一步:由于我们选择的是QJM方案,需要使用到zookeeper,所以在各个DataNode节点上启动zookeeper服务
  第二步:在其中一台NameNode节点(这里我预选取的是NameNode Active节点)启动journalnode服务,该服务用于共享存储,同步节点信息。
  第三步:若是首次启动,需要在其中一台NameNode Active节点上格式HDFS
  第四步:接着我们同样一台NameNode Active节点格式化zkfc,它对应的类是DFSZKFailoverController
  第五步:在NameNode Active节点启动hdfs服务和yarn服务
  第六步:同步NameNode Active节点的元数据

3.结束语

  这就是本节的主要内容,主要就对Hadoop做一个回顾学习,对后续学习Hadoop项目实战做一个准备工作。

  如果本教程能帮助到您,希望您能点击进去观看一下,谢谢您的支持!

  转载请注明出处,谢谢合作!

   本课程的视频教程地址:《Hadoop 回顾

Hadoop项目实战-用户行为分析之应用概述(一)的更多相关文章

  1. Hadoop项目实战-用户行为分析之应用概述(三)

    1.概述 本课程的视频教程地址:<项目工程准备> 本节给大家分享的主题如下图所示: 下面我开始为大家分享今天的第三节的内容——<项目工程准备>,接下来开始分享今天的内容. 2. ...

  2. Hadoop项目实战-用户行为分析之分析与设计

    1.概述 本课程的视频教程地址:<用户行为分析之分析与设计> 下面开始本教程的学习,本教程以用户行为分析案例为基础,带着大家对项目的各个指标做详细的分析,对项目的整体设计做合理的规划,让大 ...

  3. Hadoop项目实战-用户行为分析之应用概述(二)

    1.概述 本课程的视频教程地址:<项目整体概述> 本节给大家分享的主题如下图所示: 下面我开始为大家分享第二节的内容——<项目整体概述>,下面开始今天的分享内容. 2.内容 从 ...

  4. Hadoop项目实战-用户行为分析之编码实践

    1.概述 本课程的视频教程地址:<用户行为分析之编码实践> 本课程以用户行为分析案例为基础,带着大家去完成对各个KPI的编码工作,以及应用调度工作,让大家通过本课程掌握Hadoop项目的编 ...

  5. Hadoop项目实战

    这个项目是流量经营项目,通过Hadoop的离线数据项目. 运营商通过HTTP日志,分析用户的上网行为数据,进行行为轨迹的增强. HTTP数据格式为: 流程: 系统架构: 技术选型: 这里只针对其中的一 ...

  6. Hadoop:实战Web日志分析

    示例场景 日志说明 有两台Web服务器,日志文件存放在/usr/local/nginx/logs/目录,日志默认为nginx定义格式.如: 123.13.17.13 - - [25/Aug/2016: ...

  7. hadoop实例-网站用户行为分析

    一.数据集 网站用户购物行为数据集2030万条,包括raw_user.csv(2000万条)和small_user.csv(30万条,适合新手) 字段说明: user_id 用户编号,item_id ...

  8. hadoop项目实战--ETL--(一)项目分析

    项目描述 一 项目简介 在远程服务器上的数据库中有两张表,user 和order,现需要对表中的数据做分析,将分析后的结果再存到mysql中.两张表的结构如下图所示 现需要分析每一天user和,ode ...

  9. hadoop项目实战--ETL--(二)实现自动向mysql中添加数据

    四 项目开发 1 创建数据库db_etl,新建两张表user 和oder.表结构如第一部分图所示. 2 编写python脚本,实现自动向mysql中插入数据. 新建python 项目,目录结构如下图 ...

随机推荐

  1. 第一个用IDEA写的程序——“前言中不允许有内容”

    "前言中不允许有内容" 这是用IDEA写的第一个程序-- 它出现了一些问题 让人很难过 希望有人可以帮助解答,谢谢 程序是这样子的 运行完是这样显示的

  2. 互联网公司的面试官是如何360°无死角考察候选人的?[z]

    [z]https://juejin.im/post/5c0e47ebf265da614e2be9a7 一.写在前面 最近收到不少读者反馈,说自己在应聘一些中大型互联网公司的Java工程师岗位时遇到了不 ...

  3. Django之Form、ModelForm 组件

    Django之Form.ModelForm 组件 一.Form组件: django框架提供了一个form类,来处理web开发中的表单相关事项.众所周知,form最常做的是对用户输入的内容进行验证,为此 ...

  4. JS-基础动画心得

    写在前面的话:这两种动画方式主要在于对其中算法的理解,理解其中的向上和向下取整很关键.还有一个我犯的毛病,写样式的时候忘记给轮播图ul定位,导致效果出不来,所以有bug时记得排除下css 常用的三种动 ...

  5. concurrent.futures模块(进程池/线程池)

    需要注意一下不能无限的开进程,不能无限的开线程最常用的就是开进程池,开线程池.其中回调函数非常重要回调函数其实可以作为一种编程思想,谁好了谁就去掉 只要你用并发,就会有锁的问题,但是你不能一直去自己加 ...

  6. Win10电脑系统使用技巧

    现如今,电脑已经成为我们不可或缺的伙伴,陪伴着我们的工作.娱乐和生活,而Windows10在大家使用的电脑中占据了大多数,但是很多的小伙伴对它的许多功能并不真正了解,今天小编就带大家了解一下这些技巧, ...

  7. 定义java中的变量

    四种类型 1.整数 2.小数 3.字符 4.布尔值 八种 整数(byte   字节1   范围-128~127 )    (short   字节 2)    (int    字节4)     (lon ...

  8. Linux 下编译 有多个子程序文件的Fortran程序

    第一种方法 ifort -o outprogram Source1.f90 Source2.f90 第二种 在主程序中include 'Source2.f90' program main call p ...

  9. python任意进制转换

    python任意进制转换 import string def module_n_converter(q, s, base=None): """ 将自然数按照给定的字符串转 ...

  10. android开发环境配置以及测试所遇到的的问题

    今天我没有继续进行,整理了一线之前犯下的错误.在一开始的android的环境配置的时候,按照网上的教程,我还是走了许多弯道,其中遇到了不少的问题,但是现在都一一解决了. 配置时安装东西少 在配置的时候 ...