Hive配置项的含义详解

关于MetaStore：metastore是个独立的关系数据库，用来持久化schema和系统元数据。

hive.metastore.local：控制hive是否连接一个远程metastore服务器还是开启一个本地客户端jvm，默认是true，Hive0.10已经取消了该配置项；

javax.jdo.option.ConnectionURL：JDBC连接字符串，默认jdbc:derby:;databaseName=metastore_db;create=true；

javax.jdo.option.ConnectionDriverName：JDBC的driver，默认org.apache.derby.jdbc.EmbeddedDriver；

javax.jdo.PersisteneManagerFactoryClass：实现JDO PersistenceManagerFactory的类名，默认org.datanucleus.jdo.JDOPersistenceManagerFactory；

javax.jdo.option.DetachAllOnCommit：事务提交后detach所有提交的对象，默认是true；

javax.jdo.option.NonTransactionalRead：是否允许非事务的读，默认是true；

javax.jdo.option.ConnectionUserName：username，默认APP；

javax.jdo.option.ConnectionPassword：password，默认mine；

javax.jdo.option.Multithreaded：是否支持并发访问metastore，默认是true；

datanucleus.connectionPoolingType：使用连接池来访问JDBC metastore，默认是DBCP；

datanucleus.validateTables：检查是否存在表的schema，默认是false；

datanucleus.validateColumns：检查是否存在列的schema，默认false；

datanucleus.validateConstraints：检查是否存在constraint的schema，默认false；

datanucleus.stroeManagerType：元数据存储类型，默认rdbms；

datanucleus.autoCreateSchema：在不存在时是否自动创建必要的schema，默认是true；

datanucleus.aotuStartMechanismMode：如果元数据表不正确，抛出异常，默认是checked；

datanucleus.transactionIsolation：默认的事务隔离级别，默认是read-committed；

datanucleus.cache.level2：使用二级缓存，默认是false；

datanucleus.cache.level2.type：二级缓存的类型，有两种，SOFT:软引用，WEAK:弱引用，默认是SOFT；

datanucleus.identifierFactory：id工厂生产表和列名的名字，默认是datanucleus；

datanucleus.plugin.pluginRegistryBundleCheck：当plugin被发现并且重复时的行为，默认是LOG；

hive.metastroe.warehouse.dir：数据仓库的位置，默认是/user/hive/warehouse；

hive.metastore.execute.setugi：非安全模式，设置为true会令metastore以客户端的用户和组权限执行DFS操作，默认是false，这个属性需要服务端和客户端同时设置；

hive.metastore.event.listeners：metastore的事件监听器列表，逗号隔开，默认是空；

hive.metastore.partition.inherit.table.properties：当新建分区时自动继承的key列表，默认是空；

hive.metastore.end.function.listeners：metastore函数执行结束时的监听器列表，默认是空；

hive.metastore.event.expiry.duration：事件表中事件的过期时间，默认是0；

hive.metastore.event.clean.freq：metastore中清理过期事件的定时器的运行周期，默认是0；

hive.metastore.connect.retries：创建metastore连接时的重试次数，默认是5；

hive.metastore.client.connect.retry.delay：客户端在连续的重试连接等待的时间，默认1；

hive.metastore.client.socket.timeout：客户端socket超时时间，默认20秒；

hive.metastore.rawstore.impl：原始metastore的存储实现类，默认是org.apache.hadoop.hive.metastore.ObjectStore；

hive.metastore.batch.retrieve.max：在一个batch获取中，能从metastore里取出的最大记录数，默认是300；

hive.metastore.ds.connection.url.hook：查找JDO连接url时hook的名字，默认是javax.jdo.option.ConnectionURL；

hive.metastore.ds.retry.attempts：当出现连接错误时重试连接的次数，默认是1次；

hive.metastore.ds.retry.interval：metastore重试连接的间隔时间，默认1000毫秒；

hive.metastore.server.min.threads：在thrift服务池中最小的工作线程数，默认是200；

hive.metastore.server.max.threads：最大线程数，默认是100000；

hive.metastore.server.tcp.keepalive：metastore的server是否开启长连接，长连可以预防半连接的积累，默认是true；

hive.metastore.sasl.enabled：metastore thrift接口的安全策略，开启则用SASL加密接口，客户端必须要用Kerberos机制鉴权，默认是不开启false；

hive.metastore.kerberos.keytab.file：在开启sasl后kerberos的keytab文件存放路径，默认是空；

hive.metastore.kerberos.principal：kerberos的principal，_HOST部分会动态替换，默认是hive-metastore/_HOST@EXAMPLE.COM；

hive.metastore.cache.pinobjtypes：在cache中支持的metastore的对象类型，由逗号分隔，默认是Table,StorageDescriptor,SerDeInfo,Partition,Database,Type,FieldSchema,Order；

hive.metastore.authorization.storage.checks：在做类似drop partition操作时，metastore是否要认证权限，默认是false；

hive.metastore.schema.verification：强制metastore的schema一致性，开启的话会校验在metastore中存储的信息的版本和hive的jar包中的版本一致性，并且关闭自动schema迁移，用户必须手动的升级hive并且迁移schema，关闭的话只会在版本不一致时给出警告，默认是false不开启；

Hive配置项的含义详解的更多相关文章

【转】Hive配置文件中配置项的含义详解（收藏版）
http://www.aboutyun.com/thread-7548-1-1.html 这里面列出了hive几乎所有的配置项,下面问题只是说出了几种配置项目的作用.更多内容,可以查看内容问题导读:1 ...
Hive配置文件中配置项的含义详解（收藏版）
这里面列出了hive几乎所有的配置项,下面问题只是说出了几种配置项目的作用.更多内容,可以查看内容问题导读: 1.hive输出格式的配置项是哪个? 2.hive被各种语言调用如何配置? 3.hive ...
Spring boot注解(annotation)含义详解
Spring boot注解(annotation)含义详解 @Service用于标注业务层组件@Controller用于标注控制层组件(如struts中的action)@Repository用于标注数 ...
Oracle Statspack报告中各项指标含义详解~~学习性能必看！！！
Oracle Statspack报告中各项指标含义详解~~学习性能必看!!! Data Buffer Hit Ratio#<#90# 数据块在数据缓冲区中的命中率,通常应该在90%以上,否则考虑 ...
大数据学习系列之五 ----- Hive整合HBase图文详解
引言在上一篇大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机) 和之前的大数据学习系列之二 ----- HBase环境搭建(单机) 中成功搭建了Hive和HBase的环 ...
机器学习——随机森林，RandomForestClassifier参数含义详解
1.随机森林模型 clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=4) rf_clf = c ...
Hive 的collect_set使用详解
Hive 的collect_set使用详解 https://blog.csdn.net/liyantianmin/article/details/48262109 对于非group by字段,可以 ...
Linux命令 ls -l 输出内容含义详解
Linux命令 ls -l s输出内容含义详解 1. ls 只显示文件名或者文件目录 2. ls -l(这个参数是字母L的小写,不是数字1) 用来查看详细的文件资料在某个目录下键入ls -l可 ...
Python中的__name__和__main__含义详解
1背景在写Python代码和看Python代码时,我们常常可以看到这样的代码: ? 1 2 3 4 5 def main(): ...... if __name == "__m ...

随机推荐

尝试Office 2003 VSTO的开发、部署
转载:http://www.cnblogs.com/oneivan/p/4243574.html 背景:一年前,某项目需要使用到Excel进行数据录入,考虑到很多用户还是使用XP+Office 200 ...
Linux 系统安装[Redhat]2
1.1. 配置网络开机启动网卡eth0 1. 修改网络信息[root@Webserver ~]# vim /etc/sysconfig/network-scripts/ifcfg-eth0 DEVI ...
在oracle电子商务套件中输出信息
一.用自定义用户HAND_SL登陆http://zd01.haasgz.hand-china.com:30000/ 添加可执行并发程序执行文件名填写自己的包名称.入口函数/过程名二.将可执行程序添 ...
超强windows10稳定Nginx绿色环境，可无限自定义PHP和mysql版本、同时运行N个版本
转载自互联网, 小编发现最近PHPWAMP集成环境的作者Lccee,又更新了phpwamp8.8.8.8n版本 phpwamp8.8.8.8n一共集成了12个PHP版本和3个mysql版本,并且可以高 ...
Python3基本数据类型（二、字符串）
Python3字符串 ①字符串比较 1.比较字符串是否相同: ==:使用==来比较两个字符串内的value值是否相同 is:比较两个字符串的id值. 2.字符串的长度比较 len():显示字符串的长度 ...
12、Node.js 路由
这里实现的好像就是把路由和服务器相结合起来.具体需要引入 url 模块和 http 模块为路由提供请求的 URL 和其他需要的 GET 及 POST 参数,随后路由需要根据这些数据来执行相应的代码需要 ...
https nginx 设置
https://www.digitalocean.com/community/tutorials/how-to-create-an-ssl-certificate-on-nginx-for-ubunt ...
从Vue-router到html5的pushState
最近在用vue的时候突然想到一个问题首先,我们知道vue实现的单页应用中一般不会去刷新页面,因为刷新之后页面中的vuex数据就不见了. 其次,我们也知道一般情况下,url变更的时候,比如指定loca ...
CADisplayLink分析
1.固定频率定时器: 2.UI帧率性能检测: 3.cpu动画控制器:
POJ3041 Asteroids（匈牙利算法）
嘟嘟嘟虽然我已经会网络流了,但是还是学了一个匈牙利算法. --就跟我会线段树,但还是学了树状数组一样. 其实匈牙利算法挺暴力的.简单来说就是先贪心匹配,然后如果左部点\(i\)匹配不上了,就尝试更改 ...

Hive配置项的含义详解

Hive配置项的含义详解的更多相关文章

随机推荐

热门专题