五一一天在家搭建好了集群,要上班了来不及整理,待下周周末有时间好好整理整理一个完整的搭建hadoop生态圈的集群的系列

  1. 若出现license information(license not accepted),即说明需要同意许可信息,输入1-回车-2-回车-c-回车-c回车,即可解决。

1.关闭防火墙

Centos7的防火墙与以前版本有很大区别,CentOs7这个版本的防火墙默认是使用的firewall,与之前的版本使用iptables不一样。

关闭防火墙:sudo systemctl stop firewalld.service

关闭开机启动:sudo systemctl disable firewalld.service

查看防火墙的状态:systemctl status firewalld

firewalld常用命令:https://xiaoguo.net/wiki/centos-7-firewalld.html

2.永久关闭selinux

查看SELinux的状态:/usr/sbin/sestatus -v 或者 /usr/sbin/getenforece

临时关闭SELinux:setenforece 0 ##设置SELinux 成为permissive模式

##setenforce 1 设置SELinux 成为enforcing模式

永久关闭selinux:修改/etc/selinux/config文件,将SELINUX=enforcing 改为SELINUX=disabled,重启机器即可sudo reboot

3.搭建单机伪分布式

参考:http://www.aboutyun.com/thread-12798-1-1.html

多次hdfs namenode -format会导致namenode的clusterID和datanode的clusterID不一致,长传不了文件

5.设置静态IP

集群Ip需要设置为静态ip,不然这个ip可能会变。

修改对应网卡的配置:vim /etc/sysconfig/network-scripts/ifcfg-eth0

设置: BOOTPROTO="static" #将dhcp改为static

ONBOOT="yes" #开机启用本设置

IPADDR=192.168.7.106 #静态ip地址

GATEWAY=192.168.7.1 #默认网关

NETMASK=255.255.255.0 #子网掩码

DNS1=192.168.7.1 #DNS 配置

重启网络服务:service network restart

查看改动后的效果:ip addr #Centos7后不再使用ifconfig而是用ip 命令查看网络信息

使用sudo时user is not in sudoers file 的解决

解决办法:

以root用户修改/ete/sudoer 文件属性为root可修改,并在root ALL 行下添加 oracle ALL(类似root行)

[root@DBA2 etc]# chmod u+w sudoers

[root@DBA2 etc]# vi sudoers

添加 oracle    ALL=(ALL)    ALL

 

将sudoer属性改回原值:

[root@DBA2 etc]# chmod u-w sudoers

[root@DBA2 etc]# ll sudoers

-r--r----- 1 root root 3402 Sep  4 10:40 sudoers

 

再试试sudo的命令,可以使用了;

[oracle@DBA2 ~]$ sudo ps -ef|grep dbw

[sudo] password for oracle:

oracle    3140    1  0 09:28 ?        00:00:06 ora_dbw0_orcl2

oracle  19299 17065  0 10:41 pts/2    00:00:00 grep dbw

  1. 修改配置文件主机名

    hostname  name

    vim /etc/hostname

  2. 免密码登录 http://www.360doc.com/content/16/0831/21/19351147_587364587.shtml

  3. 卸载centos7 自带的OpenJDK http://blog.csdn.net/xiegh2014/article/details/52343438

  4. hadoop http://www.open-open.com/lib/view/open1435761287778.html

  5. hadoop 环境变量 http://blog.sina.com.cn/s/blog_a001e5980102vqk2.html

完全卸载mysql http://blog.csdn.net/typa01_kk/article/details/49057073

8. 安装mysql http://www.centoscn.com/mysql/2016/0315/6844.html

9. 设置 mysql root 密码 http://blog.csdn.net/xyang81/article/details/51759200

10. 安装scala和spark http://blog.csdn.net/ling811/article/details/51897799

  1. Hbase http://www.cnblogs.com/sdksdk0/p/5605013.html
  2. Hbase http://www.cnblogs.com/machong/p/6141990.html

配置Hadoop,hive,spark,hbase ————待整理的更多相关文章

  1. Hadoop Hive与Hbase整合+thrift

    Hadoop Hive与Hbase整合+thrift 1.  简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句 ...

  2. hadoop+hive+spark搭建(一)

    1.准备三台虚拟机 2.hadoop+hive+spark+java软件包 传送门:Hadoop官网 Hive官网 Spark官网      一.修改主机名,hosts文件 主机名修改 hostnam ...

  3. 在MacOs上配置Hadoop和Spark环境

    在MacOs上配置hadoop和spark环境 Setting up Hadoop with Spark on MacOs Instructions 准备环境 如果没有brew,先google怎样安装 ...

  4. Hadoop Hive与Hbase关系 整合

    用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库 1. 基于Ha ...

  5. centos 7 配置hadoop与spark

    cd /home mkdir shixi_enzhaocd shixi_enzhaomkdir suaneccd suanecmkdir installsmkdir libsmkdir scripts ...

  6. hadoop+hive+spark搭建(二)

    上传hive软件包到任意节点 一.安装hive软件 解压缩hive软件包到/usr/local/hadoop/目录下 重命名hive文件夹 在/etc/profile文件中添加环境变量 export ...

  7. 了解大数据的技术生态系统 Hadoop,hive,spark(转载)

    首先给出原文链接: 原文链接 大数据本身是一个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的.你能够把它比作一个厨房所以须要的各种工具. 锅碗瓢盆,各 ...

  8. 一文教你看懂大数据的技术生态圈:Hadoop,hive,spark

    转自:https://www.cnblogs.com/reed/p/7730360.html 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞 ...

  9. zookeeper笔记--配置以及和spark hbase结合使用

    Spark集群基于ZooKeeper的搭建:http://www.dataguru.cn/thread-333245-1-1.html Spark需要修改的地方: 进入spark的配置目录,参照下面代 ...

随机推荐

  1. Flutter常用命令和mac电脑常用命令

    0.  flutter create example_demo  新建flutter项目 1.flutter packages get  安装新增的包 2.flutter run 运行flutter项 ...

  2. spring bean容器加载后执行初始化处理@PostConstruct

    先说业务场景,我在系统启动后想要维护一个List常驻内存,因为我可能经常需要查询它,但它很少更新,而且数据量不大,明显符合缓存的特质,但我又不像引入第三方缓存.现在的问题是,该List的内容是从数据库 ...

  3. mysql无法导入函数和存储过程解决方法

    1. mysql> SET GLOBAL log_bin_trust_function_creators = 1; 2. 系统启动时 --log-bin-trust-function-creat ...

  4. python 中 dict 的另一种用法

    python 中 dic另一种用法 描述 Python 字典(Dictionary) get() 函数返回指定键的值,如果值不在字典中返回默认值. 语法 dict={} dict.get(k1,Non ...

  5. Centos7彻底删除PHP

    查看php版本命令: #php -v 下面的命令是删除不干净的 #yum remove php 因为使用这个命令以后再用 #php -v 还是会看到有版本信息的..... 必须强制删除,使用下面命令查 ...

  6. Spring Cloud(8):日志及分布式跟踪(Sleuth&Zipkin)

    简介 在微服务架构中,项目中前端发起一个请求,后端可能跨几个服务调用才能完成这个请求.如果系统越来越庞大,服务之间的调用与被调用关系就会变得很复杂,那么这时候我们需要分析具体哪一个服务出问题了就会显得 ...

  7. Win 7 环境上,ThingsBoard安装及启动

    一.参考官方网址进行Thingsboard的下载与安装, 官方教程https://thingsboard.io/docs/user-guide/install/windows/#step-2-thin ...

  8. electron node.js 在 vscode 设置 调试 Debug

    在当前工程下,添加一个 .vscode/launch.json 文件 { // Use IntelliSense to learn about possible attributes. // Hove ...

  9. typescript无法识别vue中的$refs

    例如:vue-fullscreen <template> <div class="Test"> <fullscreen ref="fulls ...

  10. [转帖]持久化journalctl日志清空命令查看配置参数详解

    持久化journalctl日志清空命令查看配置参数详解 最近 linux上面部署服务 习惯使用systemd 进行处理 这样最大的好处能够 使用journalctl 进行查看日志信息. 今天清理了下 ...