Hadoop spark mongo复制集

启动hadoop

cd /usr/local/hadoop/hadoop

$hadoop namenode -format			# 启动前格式化namenode

$./sbin/start-all.sh

检查是否启动成功

[hadoop@hadoop1 hadoop]$ jps

16855 NodeManager

16999 Jps

16090 NameNode

16570 ResourceManager

16396 SecondaryNameNode

[hadoop@hadoop1 hadoop]$

/usr/local/hadoop/hadoop

[hadoop@hadoop2 hadoop]$ jps

1378 NodeManager

1239 DataNode

1528 Jps

[hadoop@hadoop2 hadoop]$

停止

$./sbin/stop-all.sh

启动spark

cd /usr/local/hadoop/spark/

./sbin/start-all.sh

检查是否启动成功

[hadoop@hadoop1 spark]$ jps

16855 NodeManager

17223 Master

17447 Jps

17369 Worker

16090 NameNode

16570 ResourceManager

16396 SecondaryNameNode

[hadoop@hadoop1 spark]$

[hadoop@hadoop2 spark]$ jps

1378 NodeManager

1239 DataNode

2280 Worker

2382 Jps

[hadoop@hadoop2 spark]$

停止

$./sbin/stop-all.sh

pyspark_mongo复制集_hdfs_hbase

启动mongo复制集

[

/usr/local/mongodb/安装后，初始化

    mkdir -p /mnt/mongodb_data/{data,log};

    mkdir conf/;

    vim /usr/local/mongodb/conf/mongod.conf;

     [

       mv /mnt/mongodb_data/data /mnt/mongodb_data/data$(date +"%Y%m%d_%H%I%S");  mkdir /mnt/mongodb_data/data;

     ]

    ``

bind_ip=0.0.0.0

port=

dbpath=/mnt/mongodb_data/data

logpath=/mnt/mongodb_data/log/mongod.log

pidfilepath=/usr/local/mongodb/mongo.pid

fork=true

logappend=true

    scp /usr/local/mongodb/conf/mongod.conf root@hadoop2:/usr/local/mongodb/conf/;

    启动服务

    /usr/local/mongodb/bin/mongod -f /usr/local/mongodb/conf/mongod.conf

    进入读写窗设置admin账号

    /usr/local/mongodb/bin/mongo

use admin;

db.createUser(

  {

    user: "admin",

    pwd: "admin123",

    roles: [ { role: "userAdminAnyDatabase", db: "admin" } ,"clusterAdmin"]

  }

);

    检验是否添加成功

    db.getUsers()

    关闭服务mongod

    db.shutdownServer()

    退出mongo

    exit

    对配置文件加入ip限制和复制集配置

    vim /usr/local/mongodb/conf/mongod.conf;

replSet=repl_test

keyFile=/usr/local/mongodb/conf/keyFile

shardsvr=true

directoryperdb=true

    /usr/local/mongodb/bin/mongod -f /usr/local/mongodb/conf/mongod.conf

    进入任一节点mongo窗，进入读写

    /usr/local/mongodb/bin/mongo

    use admin;

    db.auth("admin","admin123");

    设置复制集

    rs.status();

    rs.();

    rs.status();

    rs.add("hadoop2:27017");

    rs.status();

    复制集无误后，库表、角色、用户设计；

    use pyspark;

    db.createUser(

   {

         user: "pyspark_admin",

         pwd: "admin123",

        roles: [ "readWrite", "dbAdmin" ]

       }

    );

    db.getRoles();

    db.getUsers();

    db.auth("pyspark_admin","admin123");

    show collections;

    db.createCollection('direct_ad_consume');

    db.createCollection('sem_z_cashier');

    show collections;

    db.createCollection('testpy');

    db.createCollection('departuredelays');

    db.createCollection('airport-codes-na');

    db.createCollection('ccFraud');

    db.sem_z_cashier.drop();

]

spark数据源;

单个大文件hdfs、hbase

序列化文件mongo复制集，可以考虑spark-mongo组件

执行spark

cd /usr/local/hadoop/

启动hadoop

cd /usr/local/hadoop/hadoop

$hadoop namenode -format            # 启动前格式化namenode

$./sbin/start-all.sh

检查是否启动成功

[hadoop@hadoop1 hadoop]$ jps

 NodeManager

 Jps

 NameNode

 ResourceManager

 SecondaryNameNode

[hadoop@hadoop1 hadoop]$

/usr/local/hadoop/hadoop

[hadoop@hadoop2 hadoop]$ jps

 NodeManager

 DataNode

 Jps

[hadoop@hadoop2 hadoop]$

停止

$./sbin/stop-all.sh

启动spark

cd /usr/local/hadoop/spark/

./sbin/start-all.sh

检查是否启动成功

[hadoop@hadoop1 spark]$ jps

 NodeManager

 Master

 Jps

 Worker

 NameNode

 ResourceManager

 SecondaryNameNode

[hadoop@hadoop1 spark]$

[hadoop@hadoop2 spark]$ jps

 NodeManager

 DataNode

 Worker

 Jps

[hadoop@hadoop2 spark]$

停止

$./sbin/stop-all.sh

Hadoop spark mongo复制集的更多相关文章

mongo复制集脑裂问题如何处理
mongo replication 脑裂问题如何处理: 一.问题描述:一套mongo replication有4个节点.1个仲裁节点.在停止实例(或实例毁坏)的时候,导致所有节点都变为SECONDAR ...
mongo 复制集命令
1.登录primary2.use admin >rs.add("new_node:port") 或 rs.add({"_id":4,"host& ...
mongo复制集、分片集（亲测）
1.1 架构思路: 192.168.50.131 192.168.50.131 192.168.50.132 mongos mongos mongos ...
单机Mongo复制集安装配置（数据库版本：4.x）
官方文档: https://docs.mongodb.com/manual/tutorial/deploy-replica-set-with-keyfile-access-control/#dep ...
hadoop - spark on yarn 集群搭建
一.环境准备 1. 机器: 3 台虚拟机机器角色 l-qta3.sp.beta.cn0 NameNode,ResourceManager,spark的master l-querydiff1.sp ...
工作中Hadoop,Spark,Phoenix,Impala 集群中遇到坑及解决方案
1.HDFS 修复问题描述:其他部门在yarn平台上跑spark 程序错误的生成了海量的不到100K的小文件,导致namenode压力过大,其中一个namenode宕机后,没有及时发现使得edit ...
MongoDB复制集搭建（3.4.17版）
==版本== mongodb-linux-x86_64-rhel70-3.4.17.tgz ==准备== 3个节点,我这里的IP及hostname分别是: 10.11.2.52 dscn49 10.1 ...
docker添加mongo4.0.3并配置复制集
1.创建docker 具体略过自行百度 2.创建数据持久化目录文件(/data/mongo0是个例子命名随意) 拉取mongo docker pull mongo:4.0.3 3.启动容器 do ...
Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...

随机推荐

[BZOJ2393] Cirno的完美算数教室（dfs+容斥原理）
传送门先通过dfs预处理出来所有只有2和9的数,也就大概2000多个. 想在[L,R]中找到是这些数的倍数的数,可以通过容斥原理那么如果a % b == 0,那么便可以把 a 去掉,因为 b 的倍 ...
Caffe的Solver参数设置
Caffe的solver参数设置 http://caffe.berkeleyvision.org/tutorial/solver.html solver是通过协调前向-反向传播的参数更新来控制参数优化 ...
bzoj1411: [ZJOI2009]硬币游戏
1411: [ZJOI2009]硬币游戏 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 965 Solved: 420[Submit][Status ...
Codevs 2801 LOL盖伦的蹲草计划
题目描述 Description 众所周知,LOL这款伟大的游戏,有个叫盖伦的英雄.他的伟大之处在于他特别喜欢蹲草丛阴人(XL:蹲草阴人也算英雄?!CZQ:没办法,个个都是这么玩的).某日,德玛西亚与 ...
*AtCoder Regular Contest 096F - Sweet Alchemy
$n \leq 50$的树,每个点有权值,现要选点(可多次选一个点)使点数尽量多,如下限制:选的总权值不超过$C \leq 1e9$:$c_i$表示$i$选的次数,$p_i$表示$i$的父亲,那么$c ...
「CodePlus 2018 3 月赛」白金元首与莫斯科
$n \leq 17,m \leq 17$,$n*m$的01矩形,对每一个0问:当他单独变成1之后,在其他0处放多米诺牌(不一定放满,可以不放)的方案数.膜$1e9+7$. 直接$dp$是$n^42^ ...
Valentine's Day Round hdu 5176 The Experience of Love [好题带权并查集 unsigned long long]
传送门 The Experience of Love Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Ja ...
标准C程序设计七---12
Linux应用编程深入语言编程标准C程序设计七---经典C11程序设计以下内容为阅读: <标准C程序设计>(第7版) 作者 ...
msp430项目编程52
msp430综合项目---扩展项目二52 1.电路工作原理 2.代码(显示部分) 3.代码(功能实现) 4.项目总结
Python入门--8--字符串
一.创建.修改字符串 str1='呆呆槑槑木木林林' str1[1] #输出呆 str1[2] #输出' ',也就是空值 str1=str[:5]+'插入乖呆 '+str1[5:] #修改字符串 ...

Hadoop spark mongo复制集

Hadoop spark mongo复制集的更多相关文章

随机推荐

热门专题