replication factor

http://www.tuicool.com/articles/RJbIBj

关于Hadoop中replication factor解惑

时间 2014-06-09 08:00:50  ITeye-博客

原文 http://shift-alt-ctrl.iteye.com/blog/2077548

主题 Hadoop HBase

我们在向hadoop写入文件时，这个文件的“replication”个数到底该如何控制？

在hadoop server端，core-site.xml中有个参数为“file.replication”,同时在hdfs-site.xml中也有个“dfs.replication”，这两个参数到底谁可以决定文件的“replication”个数？

在hadoop开发时，我们还可以在Client端配置core-site.xml和hdfs.xml，那么上述两个参数是否会生效呢？

在hbase中，该如何决定replication个数？

我最近在部署和开发时就被这么几个参数给迷惑了，hdfs-site.xml(或者hdfs-default.xml)中“dfs.replication”默认为3，core-site.xml(或者core-default.xml)中“file.replication”默认为1；对于hadoop server而言，hdfs进程将会首先加载“hdfs-default.xml”然后加载“hdfs-site.xml”，如果在hdfs-size.xml中指定了“dfs.replication”，那么此值将作为server端默认值；在此处需要提醒，“file.replication”参数值将不会发挥效果，从源码中可以看出hadoop并没有使用core-site.xml(core-default.xml)中“file.replication”参数值，因此尝试修改此值来改变hdfs的replication个数是徒劳的。

对于hadoop Client开发而言，如果开发者没有引入自己的hdfs-site.xml文件，那么在创建文件时所使用的Configuration对象只是加载了默认配置(hdfs-default.xml,core-default.xml)，因此“dfs.replication”仍然为3，基于“Client端配置优先”的策略，那么hadoop server端hdfs-site.xml中的“dfs.replication”值将会被覆盖。因此，如果开发者希望调整replication factor，唯一的方式，就是在Client端引入自己的hdfs-site.xml且调整此值，或者在FileSystem.create方法中手动指定replication个数。

hbase从架构模式上，它在存储层面只是一个hadoop Client端；如果你希望调整hbase中数据的replication个数，我们还需要在hbase server端引入hdfs-site.xml文件，然后把这个文件放入${hbase}/conf目录下，否则hbase数据的replication将始终为3。

此外需要提醒，在hbase开发时，在hbase Client端尝试引入“core-site.xml”和“hdfs-site.xml”来修改hdfs相关属性的方式是徒劳的，hbase Client只有引入的“hbase-site.xml”文件是有效的；如果希望在hbase中修改部分hadoop的属性，只能在hbase server端的“hbase-site.xml”中修改，或者额外的引入“core-site.xml”和“hdfs-site.xml”。

replication factor的更多相关文章

kafka创建会话，报Error while executing topic command : Replication factor: 1 larger than available brokers: 0.
bin/kafka-topics.sh --create --zookeeper es1:2181 --replication-factor 1 --partitions 1 --topic top ...
Error while executing topic command : Replication factor: 2 larger than available brokers: 0.
[root@hdp1 /mnt/software/maxwell-1.19.4]#kafka-topics.sh --zookeeper hdp1,hdp2,hdp3:2181 --create -- ...
【kafka】kafka.admin.AdminOperationException: replication factor: 1 larger than available brokers: 0
https://blog.csdn.net/bigtree_3721/article/details/78442912 I am trying to create topics in Kafka by ...
Apache Kafka（十）Partitions与Replication Factor 调整准则
Partitions与Replication Factor调整准则 Partition 数目与Replication Factor是在创建一个topic时非常重要的两个参数,这两个参数的取值会直接影响 ...
dfs.replication 参数动态修改
首先 dfs.replication这个参数是个client参数,即node level参数.需要在每台datanode上设置.其实默认为3个副本已经够用了,设置太多也没什么用. 一个文件,上传到hd ...
Set replication in Hadoop
I was trying loading file using hadoop API as an experiment. I want to set replication to minimum as ...
Kafka Replication: The case for MirrorMaker 2.0
Apache Kafka has become an essential component of enterprise data pipelines and is used for tracking ...
Cassandra简介
在前面的一篇文章<图形数据库Neo4J简介>中,我们介绍了一种非常流行的图形数据库Neo4J的使用方法.而在本文中,我们将对另外一种类型的NoSQL数据库——Cassandra进行简单地介 ...
kafka学习笔记：知识点整理
一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...

随机推荐

PHP学习过程_Symfony_(2)
今天正式学习Symfony;首先推荐一篇文章"十分钟学习Symfony"(这是我们老大写的,由于那些搞seo的家伙的粘贴复制也不写出处,老大干脆把代码库给清理了,不过幸好我提前fo ...
Spring的字符编码过滤器CharacterEncodingFilter
Spring中的字符编码过滤器,用来解决我们项目中遇到的编码问题. 使用方式特别友好,在web.xml加入: <filter> <description>字符集过滤器</ ...
python连接MongoDB
1.安装pymongo库 windows下: pip install pymongo 或者 easy_install install pymongo 2.使用pymongo模块连接mongoDB数据库 ...
Apple pay的使用
Apple pay的使用场景:1.app内:唯品会. 2.线下场景:万达 Apple pay的硬件要求:iphone6 以上苹果婊 Apple pay的软件要求:国内(应该是)iOS9.2以上 ...
JS+CSS简单实现DIV遮罩层显示隐藏
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
Objetive-C +load方法研究
load方法的执行时机 Objetive-C 的runtime会在一个类的所有方法加载到内存中时调用这个类的+load() 方法,因为每个类的方法只是加载一次,所以每个+load( ...
Vultr免费vps注册和使用简易教程
如果你是站长,寻找托管网站的主机,或者是开发者,需要搭建服务器环境,选购vps是必须的.强烈不推荐国内的vps产品,没有性价比,维护水平又烂,甚至某些国内所谓云主机vps安装后门,监控你的数据.海外v ...
js广告图片轮播
<div class="box"> <div class="box1"></div> <div class=" ...
C++对象模型笔记之程序设计模型
C++程序设计模型支持三种程序设计模型 1.程序模型(procedural model) 可以理解为过程化模型,就像C一样 2.抽象数据类型模型(ADT) 数据结构教材里有说过,查了下资料也不是很明确 ...
Swift-HELP
//获取网页地址对应的字符串 var urlString = url.absoluteURL.absoluteString

replication factor

replication factor的更多相关文章

随机推荐

热门专题