大数据初级sy
1.spark 是用以下哪种编程语言实现的?
A.C B C++ C JAVA D.Scala (正确答案)
2.FusionInsight Manager 对服务的管理操作,下列说法错误的是?
A.可对服务进行起停重启操作 B.可以添加和卸载服务 C可设置不常用的服务隐藏或提示(正确答案) D 可查看服务的当前状态
3.FusionInsight HD 集群升级,以下描述正确的有?(多选)
A 升级过程中不可以手工操作主备 OMS倒换(正确答案)
B 集群内所有主机的root账户密码要保持一致(正确答案)
C 保持网络畅通,避免因网络问题导致升级异常(正确答案)
D观察期不能做扩容(正确答案)
4.fusioninsight HD 的loader在创建作业时,连接器(connector)有什么作用?
A.确定有哪些转换步骤
B.提供优化参数,提高数据导入导出性能
C配置作业如何与外部数据源进行连接(正确答案)
D配置作业如何与内部数据源进行连接
5.下列哪个HDFS命令可用于检测数据块的完整性?
A.hdfs fsck /(正确答案)
B.hdfs fsck / -delete
C.hdfs dfsadmin -report
D.hdfs balancer-threshold 1
6.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?
A.yarn scheduler capacity root QueueA user-limit-factor
B.yarn scheduler capacity root QueueA minimum-user-limit-percent
C.yarn scheduler capacity root QueueA state
D.yarn scheduler capacity root QueueA maximum-capacity(正确定位)
7.Flume的数据流可以根据header 的信息发送到不同的channel中.
A.正确 (正确答案) B,错误
8.Fusioninsight Manager 与外部管理平台对接时,支持哪些接口?(多选)
A.SNMP (正确答案)
B.VPN
C.BGP
D.Syslog(正确答案)
9.Hbase的数据文件HFile中的一个KeyValue格式包含哪些信息?(多选)
A.Key (正确答案)
B.Value(正确答案)
C.TimeStamp(正确答案)
D.Key Type(正确答案)
10.FusionInsight HG集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络带宽要求的描述,下列描述正确的有?(多选)
A.业务平面所有节点都使用10GE网络(正确答案)
B,管理平面中控制节点使用10GE网络
C.管理平面中数据节点使用10GE网络(正确答案)
D.管理平面中控制节点使用10GE网络
E.管理平面中管理节点使用10GE网络(正确答案)
11.FusionInsight系统中Hive支持的存储格式包括?(多选)
A.HFile
B.TextFile(正确答案)
C.SequenceFile(正确答案)
D.RCFile(正确答案).
12.Spark任务的每个stage可划分为job,划分的标记是shuffle.
A.正确 B.错误(正确答案)
13.FusionInsight Manager 对服务的配置功能说法不正确的是?
A.服务级别的配置可对所有实例生效
B.实例级别的配置只针对本实例生效
C.实例级别的配置对其它实例也生效(正确答案)
D.配置保存后需要重启服务才生效
14.FusionInsight HD部署Solr时,如果选择索引存放在本地磁盘,建议给每个SolrServer实例的数据目录单独挂载磁盘,并且磁盘为RAID0或RAID5.
A.对(正确答案) B.错
15.关于FusionInsight HD安装流程正确的是?
A.安装Manager--执行preinstall--LLD工具进行配置---安装集群--安装后检查--安装后配置
B.LLD工具进行配置--执行reinstall--安装Manager--安装集群--安装后检查--安装后配置(正确答案)
C.安装Manager--LLD工具进行配置--执行preinstall--安装集群--安装后检查--安装后配置
D.LLD工具进行配置--执行preinstall--安装集群--安装Manager--安装后检查--安装后配置
16.关于Kerberos部署,描述正确的是?
A.Kerberos仅有一个角色
B.Kerberos服务在同一个节点上有两个实例(正确答案)
C.Kerberos服务采用主备模式部署
D.Kerberos服务必须和LDAP服务部署在同一个节点上
17.某银行规划的FusionInsight HD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划多少最为合理?
A.87(正确答案)
B.85
C.90
D.86
18.安装FusionInsight HD软件包前,必须在本节点/etc/hosts文件中配置集群所有节点的主机名称与业务IP的映射关系.
A.正确(正确答案) B.错误
19.客户IT系统中FusionInsight HD集群有150个节点,每个节点12块磁盘(不做RAID,不包括OS盘),每个磁盘大小1T,只安装HDFS,按照默认配置最大可存储多少数据?
A.1764TB
B.1800TB
C.600TB
D,500TB(正确答案)
20.FusionInsight HD节点不支持哪种主机操作系统?
A.Suse
B.RedHat 6.5
C.CentOS 6.4
D.Ubuntu 11.0.4(正确答案)
21.FusionInsight HD中,如果需要检查当前登录HBase的用户和权限组,可以在HBase shell中执行什么命令?
A.use_permission
B.whoami(正确答案)
C.who
D.get_user
22.FusionInsight HD产品在部署Kerberos和LDAP服务时,一下描述正确的是?(多选)
A.部署Kerberos服务之前,必须先部署LDAP服务(正确答案)
B.LDAP服务必须和Kerberos服务部署在同一个节点
C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提升(正确答案)
D.LDAP服务可以多个集群共享
23.FusionInsight HD Manager界面Hive日志收集,哪个选项不正确?
A.可指定实例进行日志收集,比如指定单独收集MetaStore的日志
B.可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志
C.可指定节点IP进行日志收集,例如仅下载某个ip的日志
D.可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)
24.华为FusionInsight HD集群中,Spark 服务可以从以下哪些服务读取数据?(多选)
A.YARN
B.HDFS(正确答案)
C.Hive(正确答案)
D.HBase(正确答案)
25.如果YARN集群中只有Default ,QueueA和QueueB子队列时,那么允许讲他们的容量分别设置为60%,25%和22%.
A.正确 B.错误(正确答案)
26.FusionInsight HD系统中,关于Solr索引的存储部署策略,一下说法正确的有?(多选)
A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储于HDFS.(正确答案)
B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据
C.当对实时索引录入速度要求较高时,可选择索引存放于本地磁盘.(正确答案)
D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上.(正确答案)
27.FusionInsight HD三层组网适合多少节点的集群规模?
A.30节点一下7
B,100节点以上
C.100~200节点
D.200节点以上(正确答案)
28.FusionInsight HD系统中,Kerberos仅用于组件间服务安全认证.
A.正确
B.错误(正确答案)
大数据初级sy的更多相关文章
- 大数据初级笔记二:Hadoop入门之Hadoop集群搭建
Hadoop集群搭建 把环境全部准备好,包括编程环境. JDK安装 版本要求: 强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术 ...
- 【SQL server初级】数据库性能优化一:数据库自身优化(大数据量)
数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分 数据库性能优化一:数据库自身优化 优化①:增加次数据文件,设置文件自动增长(粗略数据分区) 1.1:增加次数据文 ...
- Spark大数据的学习历程
Spark主要的编程语言是Scala,选择Scala是因为它的简洁性(Scala可以很方便在交互式下使用)和性能(JVM上的静态强类型语言).Spark支持Java编程,但对于使用Java就没有了Sp ...
- Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户
你正在使用过时的浏览器,Amaze UI 暂不支持. 请 升级浏览器 以获得更好的体验! 深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:1 ...
- 大数据公益课堂成就你高薪之梦,30W,50W,100W...
从之前的知道“大数据”这词,到2013年正式开始了解大数据领域,再到2014年深入研究大数据相关的领域,到现在逐渐影响周围的同学.朋友和家人.大数据技术将给我们带来的远不止我们想到的这些.曾经我身边的 ...
- 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生
Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...
- [Hadoop 周边] 浅谈大数据(hadoop)和移动开发(Android、IOS)开发前景【转】
原文链接:http://www.d1net.com/bigdata/news/345893.html 先简单的做个自我介绍,我是云6期的,黑马相比其它培训机构的好偶就不在这里说,想比大家都比我清楚: ...
- 大数据与可靠性会碰撞出什么样的Spark?
可靠性工程领域的可靠性评估,可靠性仿真计算,健康检测与预管理(PHM)技术,可靠性试验,都需要大规模数据来进行支撑才能产生好的效果,以往这些数据都是不全并且收集困难,而随着互联网+的大数据时代的来临, ...
- bat坐拥大数据。数据挖掘/大数据给他们带来什么。
阿里巴巴CTO即阿里云负责人王坚博士说过一句话:云计算和大数据,你们都理解错了. 实际上,对于大数据究竟是什么业界并无共识.大数据并不是什么新鲜事物.信息革命带来的除了信息的更高效地生产.流通和消 ...
随机推荐
- VS“无法查找或打开PDB文件”解决方法
``#运行时报错提示 "温度柱状图.exe"(Win32): 已加载"C:\Windows\SysWOW64\rpcrt4.dll".无法查找或打开 PDB 文 ...
- MySQL字段默认值设置详解
前言: 在 MySQL 中,我们可以为表字段设置默认值,在表中插入一条新记录时,如果没有为某个字段赋值,系统就会自动为这个字段插入默认值.关于默认值,有些知识还是需要了解的,本篇文章我们一起来学习下字 ...
- 北航OO(2020)第四单元博客作业暨学期总结
一.第四单元架构设计 1.第一次作业 我在本次作业中设置了多个储存结构:Directory,ElementsInName,ElementsInId,Cache. Directory: 顾名思义,这是个 ...
- 简单聊聊内存逃逸 | 剑指offer - golang
问题 简单讲讲golang的内存逃逸吗? 解析 什么是内存逃逸 在程序中,每个函数块都会有自己的内存区域用来存自己的局部变量(内存占用少).返回地址.返回值之类的数据,这一块内存区域有特定的结构和寻址 ...
- Nacos服务发现
基础配置初始化 NacosDiscoveryClientConfiguration NacosDiscoveryProperties 初始化Nacos基础配置信息的bean,主要指yaml中配置Nac ...
- 『动善时』JMeter基础 — 21、HTTP Cookie管理器的使用
目录 1.在HTTP信息头管理器组件中添加Cookie信息 (1)测试计划内包含的元件 (2)请求取样器内容 (3)HTTP信息头管理器内容 (4)查看结果 2.使用HTTP Cookie管理器组件来 ...
- [bug] idea @Override is not allowed when implementing interface method
解决 将idea环境jdk设置一致 参考 https://blog.csdn.net/shenya2/article/details/50460447 https://www.cnblogs.com/ ...
- centos国内镜像下载
国内镜像下载 http://mirrors.aliyun.com/centos/6/isos/x86_64/ 如果需要下载centos 7 版本进入对应7的/isos/x86_64/ 选择minima ...
- 攻防世界(十二)upload1
攻防世界系列 :upload1 1.打开题目,文件上传. 2.立即上传shell 1.php <?php @eval($_POST[root]); ?> 提示只能上传图片 3.burp改报 ...
- 002.Ansible之Inventory文件
一 简介 在使用Ansible来批量管理主机的时候,通常我们需要先定义要管理哪些主机或者主机组,而这个用于管理主机与主机组的文件就叫做Inventory,也叫主机清单.该文件默认位于/etc/ansi ...