2014_08_23:

hadoop03c_分布式文件系统HDFS

http://v.youku.com/v_show/id_XNDgwNjg1OTY0.html?f=18604686

2014_08_27

hadoop03a_分布式文件系统HDFS,大数据存储实战

http://v.youku.com/v_show/id_XNDgwNjgwMDU2.html?f=18604686

./bin/hadoop

jobtracker(端口): 50030

namenode(端口): 50070

2014_08_29

hadoop07b_HBase体系架构与安装

http://v.youku.com/v_show/id_XNDgwNzE2MzU2.html?f=18604686

shell命令(hql): help, list, status, help, create, put, get, enable, disable...

API: for java develop.

hadoop07c_HBase体系架构与安装

http://v.youku.com/v_show/id_XNDgwNzE3Nzky.html?f=18604686

什么情况下使用hbase?

表设计跟查询有关,数据分析主题确定,查询语句确定才能设计表。应用场景不固定先不用hbase.

当数据分析的主题,场景已经固化,并且用关系型数据库已经不能胜任,PC提升到小型机,仍然不能解决瓶颈,可以考虑将关系型数据库转成hbase。高速插入,同时有简单key,value查询,不能在非时间戳上order by. 大量发生,又不能分布式处理。

场景一:浏览历史,需要实时结果,不能使用缓存。

如何分不出去?为了利用集群,可以采取类似reverse key,增加随机性。另外一种方法是算hash值,附加到rowid后边,也可以增加随机性。

场景二:商品推荐,浏览本书的人还浏览了这些东西

hadoop07d_HBase体系架构与安装

http://v.youku.com/v_show/id_XNDgwNzI1MDIw.html?f=18604686

辅助索引?不仅在时间戳的列上。

建立辅助表(索引表)。比如主表为学生表,行健为学号,列族为学生,下边的列分别是身份证号,姓名...

建立索引表,行健为省份证号,列族和列为学号。这样可以得到学号和省份证号的组合查询。

手动创建和维护索引。通过牺牲自动化,达到高性能处理大数据量的目的。

复合行健? 数据仓库中分片和钻取,不是独立的两个列,而是依次的。userid-messageid组装为行健。也可以通过范围查询。(12345-****-****, 123456),因为-的ascii码小于6.

2014_08_31

hadoop01a_Hadoop的源起与体系介绍

http://v.youku.com/v_show/id_XNDgwNjU0Mjc2.html?f=18604686

hadoop01b_Hadoop的源起与体系介绍

http://v.youku.com/v_show/id_XNDgwNjU1NDEy.html?f=18604686

索引倒排和分词,帮助实现原本需要全表扫描的where name like '%demoname%'的查询。

Google Page Rank的计算模型:

G = aS + (l-a)/n * U, S是链接矩阵,U是一个全1矩阵。

hadoop01c_Hadoop的源起与体系介绍

http://v.youku.com/v_show/id_XNDgwNjU4MDky.html?f=18604686

Namenode(and secondary namenode):

JobTracker:运行在主节点,用来处理用户提交的作业,切割为小任务,就近运行,小任务被分配到数据所在的节点运行,同时监控task。

Datanode:

Tasktrack:一个tasktacker可以启动多个JVM,并行运行mapreduce任务。

网络资源(1) - Hadoop视频的更多相关文章

  1. 炼数成金hadoop视频干货06-10

    视频地址:http://pan.baidu.com/s/1dDEgKwD 第六课统讲了hadoop几个子项目和HBase,第七课还是讲的HBase 第八课讲了PIG 第九课讲了Hive和Zookeep ...

  2. 炼数成金hadoop视频干货05

    视频地址:http://pan.baidu.com/s/1dDEgKwD 这一节是讲师助教带着动手操作写简单的开发环境的部署和两个实例 开发环境的部署:http://www.cnblogs.com/a ...

  3. 炼数成金hadoop视频干货03

    视频地址:http://pan.baidu.com/s/1dDEgKwD 着重介绍了HDFS 运行了示例程序wordcount,自己也试了一遍(用的伪分布式) 1.建立数据(和讲师的操作有些不一样,不 ...

  4. 炼数成金hadoop视频干货02

    视频地址:http://pan.baidu.com/s/1dDEgKwD 这个视频理论性太强,不过倒是给了自己唯一的选项就是自己实践,不用像以前那样视频中敲一个字符,我也敲一个字符 讲到的内容: 介绍 ...

  5. 炼数成金hadoop视频干货01

    视频地址:http://pan.baidu.com/s/1dDEgKwD 最开始还是讲hadoop的起源,但是和其他垃圾视频不同,不是照本宣科,听了还是受益.作者给人一种感觉就是他是确实把他的经验和体 ...

  6. 炼数成金hadoop视频干货04

    视频地址:http://pan.baidu.com/s/1dDEgKwD 这一节讲的全是理论 任务执行优化 : 1.推测式执行: 2.重用JVM: 3.忽略模式. 除了手动修改Log4J.proper ...

  7. 智传播客hadoop视频学习笔记(共2天)

    第一天:1.答疑解惑•  就业前景•  学习hadoop要有什么基础•  hadoop会像塞班一样,热一阵子吗•  hadoop学习起来容易还是困难•  课堂上的学习方法(所有实验必须按照要求做,重原 ...

  8. 网络资源(3) - iBatis视频

    2018_08_24 http://v.youku.com/v_show/id_XMjk2ODY2OTE2.html iBatis视频教程01

  9. 网络资源(2) - Maven视频

    2014_08_23 http://v.youku.com/v_show/id_XNDE2NzM0Nzk2.html Maven最佳实践,公司真实环境实践-私服最佳实践 2014_08_24 http ...

随机推荐

  1. HDU 2063 过山车 二分图题解

    一个男女搭配的关系图,看能够凑成多少对,基本和最原始的一个二分图谜题一样了,就是 一个岛上能够凑成多少对夫妻的问题. 所以是典型的二分图问题. 使用匈牙利算法,写成两个函数,就很清晰了. 本程序还带分 ...

  2. Android 基于Netty接收和发送推送解决方案的消息字符串(三)

    在上一篇文章中<Android 基于Netty的消息推送方案之概念和工作原理(二)> .我们介绍过一些关于Netty的概念和工作原理的内容,今天我们先来介绍一个叫做ChannelBuffe ...

  3. c#操作appsettiongs

    try { //指定要修改的配置文件的路径 Configuration config = System.Web.Configuration.WebConfigurationManager.OpenWe ...

  4. WPF中两条路径渐变的探讨

    原文:WPF中两条路径渐变的探讨 我们在WPF中,偶尔也会涉及到两条路径作一些“路径渐变 ”.先看看比较简单的情形:如下图(关键点用红色圆点加以标识):(图1) 上面图1中的第1幅图可以说是最简单的路 ...

  5. 人人API 分享到人人功能 修改版

    最近在搞一个日程管理网站, 需要实现分享到人人功能, 所以找了一下人人API, 然后根据自己需要修改了一下. 首先得有一个人人给的js文件, 如下: var Renren = Renren || {} ...

  6. poj 3375 Network Connection

    今天在叉姐的群里找点题目做,这题目还是很好的:提意思如下 [有M个可以提供计算机网络的端口和N台计算机(计算机数量少于端口数),每个端口和计算机有一个坐标(一维的)!其中端口与计算机链接的距离 |x  ...

  7. Directx11学习笔记【十四】 使用最新的Effect框架和SDK

    由于之前一直在看directx11龙书学习,因此sdk一直用的Microsoft DirectX SDK (June 2010) 版本,最近在stackoverflow上问dx11相关问题时,一直被大 ...

  8. 乐在其中设计模式(C#) - 组合模式(Composite Pattern)

    原文:乐在其中设计模式(C#) - 组合模式(Composite Pattern) [索引页][源码下载] 乐在其中设计模式(C#) - 组合模式(Composite Pattern) 作者:weba ...

  9. 【JAVA】【NIO】3、Java NIO Channel

    Java NIO和流量相似,但有些差异: ·通道可读写,流仅支持单向.读或写 ·异步通道读取 ·通道读写器,他们是和Buffer交替 道的实现 下面是Java NIO中最重要的通道的实现: ·File ...

  10. RedHat Linux乱码解决方案(转)

    RedHat Linux中出现中文乱码主要是由于没有安装中文字体,因此解决方案主要是安装中文字体,所以 第一步,挂载安装的光盘 在虚拟机的菜单栏里,选择:VM->Settings,点击Setti ...