Mongo性能测试-python脚本
单线程
500+w条数据,插入时间:1小时,13分钟。
脚本:
[root@10 hurl]# cat insert-mongo2.py
#!/usr/bin/env python
#coding=utf-8
import time,datetime
import pymongo
from pymongo import MongoClient
client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')
db = client.test
#from pymongo import Connection
#connection = Connection('127.0.0.1', 27017)
#db = connection['test']
#时间记录器
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper
@func_time
def insert(num):
posts = db.userinfo
for x in range(num):
post = {"_id" : str(x),
"author": str(x)+"Mike",
"description1":"this is a very long description for " + str(x),
"description2":"this is a very long description for " + str(x),
"description3":"this is a very long description for " + str(x),
"description4":"this is a very long description for " + str(x),
"description5":"this is a very long description for " + str(x),
"text": "My first blog post!",
"tags": ["mongodb", "python", "pymongo"],
"date": datetime.datetime.utcnow()}
posts.insert_one(post)
if x%100000 == 0:
print "100000 ! -- %s"%(datetime.datetime.now())
if __name__ == "__main__":
#设定循环1000万次
num = 10000000
insert(num)
插入总数:
mongos> db.userinfo.count()
5033914
mongos>
多进程并发:
测试脚本:
[root@10 hurl]# cat insert-mongo3.py
#!/usr/bin/env python
#coding=utf-8
import multiprocessing,random,string
import time,datetime
import pymongo
from pymongo import MongoClient
def gen_load(x,taskid):
client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')
db = client.test
posts = db.userinfo2
for x in range(1000000):
post = {"_id" : str(x),
"author": str(x)+"Mike",
"text": "My first blog post!",
"tags": ["mongodb", "python", "pymongo"],
"date": datetime.datetime.utcnow()}
posts.insert_one(post)
if x%100000 == 0:
print "100000 ! -- %s"%(datetime.datetime.now())
if __name__ == '__main__':
inser_number=2500
pro_pool = multiprocessing.Pool(processes=100)
print time.strftime('%Y-%m-%d:%H-%M-%S',time.localtime(time.time()))
start_time=time.time()
manager = multiprocessing.Manager()
for i in xrange(10):
taskid=i
pro_pool.apply_async(gen_load,args=(inser_number,taskid))
pro_pool.close()
pro_pool.join()
elapsed = time.time()-start_time
print elapsed
time.sleep(1)
print "Sub-process(es) done."
10w条数据插入
100个线程,10w条数据,86秒
[root@10 hurl]# python insert-mongo3.py
2015-12-08:13-54-53
10000 ! -- 2015-12-08 13:54:53.822510
10000 ! -- 2015-12-08 13:55:02.329206
10000 ! -- 2015-12-08 13:55:10.624850
10000 ! -- 2015-12-08 13:55:19.763308
10000 ! -- 2015-12-08 13:55:28.384718
10000 ! -- 2015-12-08 13:55:36.957917
10000 ! -- 2015-12-08 13:55:45.426113
10000 ! -- 2015-12-08 13:55:53.872843
10000 ! -- 2015-12-08 13:56:02.898263
10000 ! -- 2015-12-08 13:56:11.243706
86.4502689838
Sub-process(es) done.
100个进程:
[root@10 hurl]# ps -ef| grep python | wc -l
103
100w条数据:
100个线程,100w条数据,858秒:
[root@10 hurl]# python insert-mongo3.py
2015-12-08:14-04-21
100000 ! -- 2015-12-08 14:04:21.481368
100000 ! -- 2015-12-08 14:05:43.069700
100000 ! -- 2015-12-08 14:07:05.694774
100000 ! -- 2015-12-08 14:08:28.375586
100000 ! -- 2015-12-08 14:09:51.335589
100000 ! -- 2015-12-08 14:11:18.619572
100000 ! -- 2015-12-08 14:12:45.748144
100000 ! -- 2015-12-08 14:14:12.534341
100000 ! -- 2015-12-08 14:15:43.059457
100000 ! -- 2015-12-08 14:17:11.387942
858.129628897
Sub-process(es) done.
[root@10 hurl]#
查询:
在500w条数据中随机查询100w次,用时15秒。
[root@10 hurl]# python find-mongo2.py
find 0 .
find 100000 .
find 200000 .
find 300000 .
find 400000 .
find 500000 .
find 600000 .
find 700000 .
find 800000 .
find 900000 .
mread run: 15.3293960094
[root@10 hurl]#
脚本:
[root@10 hurl]# cat find-mongo2.py
#!/usr/bin/env python
#coding=utf-8
import time,datetime
import random
import pymongo
from pymongo import MongoClient
client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')
db = client.test
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper
#@func_time
def randy():
rand = random.randint(1,5000000)
return rand
@func_time
def mread(num):
find = db.userinfo
for i in range(num):
rand = randy()
#随机数查询
find.find({"author": str(rand)+"Mike"})
if i%100000 == 0:
print "find %s ."%i
if __name__ == "__main__":
#设定循环100万次
num = 1000000
mread(num)
无索引Update
在500w数据中,无索引update100条数据,567秒:
[root@10 hurl]# python update-mongo2.py
mread run: 567.210422993
[root@10 hurl]#
脚本:
[root@10 hurl]# cat update-mongo2.py
#!/usr/bin/env python
#coding=utf-8
import time,datetime
import random
import pymongo
from pymongo import MongoClient
client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')
db = client.test
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper
#@func_time
def randy():
rand = random.randint(1,5000000)
return rand
@func_time
def mread(num):
update = db.userinfo
for i in range(num):
rand = randy()
name = str(rand)+"Mike"
#随机数查询
print "uodate %s "%name
update.update_one({"author": name},{"$set":{"text":"My second blog post!"}})
if __name__ == "__main__":
#设定循环
num = 100
mread(num)
Create index
500w条数据,创建索引,用时70秒。
[root@10 hurl]# python index-mongo2.py
insert run: 70.6546721458
脚本:
[root@10 hurl]# vi index-mongo2.py
#!/usr/bin/env python
#coding=utf-8
import time,datetime
import pymongo
from pymongo import MongoClient
client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')
db = client.test
#时间记录器
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper
@func_time
def createInx(num):
posts = db.userinfo
posts.create_index('author', unique=True)
if __name__ == "__main__":
#设定循环
num = 1
createInx(num)
有索引Update
在500w数据中,有索引update100条数据,1.98秒:
[root@10 hurl]# python update-mongo2.py
mread run: 1.98181605339
[root@10 hurl]#
Delete
500w条数据,删除完成,使用时间:541.97秒。
[root@10 hurl]# python delete-mongo2.py
count before remove: 5033914
count after remove: 0
insert run: 541.965857983
脚本:
[root@linux-00 sh]# python delete-mongo2.py
count before remove: 100000
count after remove: 0
remove run: 0.951205015182
[root@linux-00 sh]# cat delete-mongo2.py
#!/usr/bin/env python
import time,datetime
import pymongo
from pymongo import MongoClient
client = MongoClient('mongodb://localhost:27017/')
db = client.test
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper
@func_time
def remove():
posts = db.userinfo
print 'count before remove:',posts.count();
posts.delete_many({});
print 'count after remove:',posts.count();
if __name__ == "__main__":
remove()
总结:
单进程 |
多进程 |
多进程 |
单进程 |
|
数据量 |
500w |
10w |
100w |
500w |
操作 |
insert |
insert |
insert |
Find 100w次 |
用时 |
1小时13分钟 |
86秒 |
858秒 |
15秒 |
平均(条/秒) |
1141.55 |
1162.79 |
1165.50 |
66666.67 |
注:我自己电脑上的虚拟机插入测试,单线程,10w条数据,用时30秒,平均3333条每秒
数据量 |
500w |
500w |
500w |
500w |
索引 |
无索引 |
有索引 |
||
操作 |
Update100条数据 |
Update100条数据 |
创建索引 |
delete |
用时 |
567秒 |
1.98秒 |
70.65 |
541.97秒 |
平均(条/秒) |
0.1764 |
50.51 |
70771.41 |
9225.60 |
Mongo性能测试-python脚本的更多相关文章
- python脚本批量生成数据
在平时的工作中,经常会遇到造数据,特别是性能测试的时候更是需要大量的数据.如果一条条的插入数据库或者一条条的创建数据,效率未免有点低.如何快速的造大量的测试数据呢?在不熟悉存储过程的情况下,今天给大家 ...
- 如何在python脚本开发做code review
在软件项目开发中,我们经常提到一个词“code review”.code review中文翻译过来就是代码评审或复查,简而言之就是编码完成后由其他人通过阅读代码来检查代码的质量(可编译.可运行.可读. ...
- freeswitch嵌入python脚本
操作系统:debian8.5_x64 freeswitch 版本 : 1.6.8 python版本:2.7.9 开启python模块 安装python lib库 apt-get install pyt ...
- python脚本后台运行
问题描述: 环境: CentOS6.4 一个用python写的监控脚本test1.py,用while True方式一直运行,在ssh远程(使用putty终端)时通过以下命令启动脚本: python t ...
- 某互联网后台自动化组合测试框架RF+Sikuli+Python脚本
某互联网后台自动化组合测试框架RF+Sikuli+Python脚本 http://www.jianshu.com/p/b3e204c8651a 字数949 阅读323 评论1 喜欢0 一.**Robo ...
- 动态执行python脚本
前言 存在许多独立的python脚本,这些脚本可能会增加,也可能会减少,现在需要按照某种顺序调度这些程序.在python的standard library中,有一个模块imp可以实现动态的调用ptho ...
- 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本
摘自:http://blog.csdn.net/forandever/article/details/5711319 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本 ...
- SecureCRT中python脚本编写
SecureCRT中python脚本编写学习指南 SecureCRT python 引言 在测试网络设备中,通常使用脚本对设备端进行配置和测试以及维护:对于PE设备的测试维护人员来说使用较多是Secu ...
- Python脚本配合Linux计划任务工作
经常遇到直接运行Python脚本没有问题,但是一放入/etc/crontab之后就歇菜的情况,总结了一下,大致需要注意以下几点: 1. 脚本首行加入#!/usr/bin/env python 2. 脚 ...
随机推荐
- HDU_6017_Girls love 233_(dp)(记忆化搜索)
Girls Love 233 Accepts: 30 Submissions: 218 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: ...
- Java学习4_一些基础4_输入输出_16.5.7
读取输入: 想从控制台进行输入,首先需要构造一个Scanner对象,并与“标准输入流”System.in关联. Scanner in=new Scanner(System.in); String na ...
- Jmeter之计数器
如果需要引用的数据量较大,且要求不能重复或者需要自增,那么可以使用计数器来实现. 计数器(counter):允许用户创建一个在线程组之内都可以被引用的计数器. 计数器允许用户配置一个起点,一个最大值, ...
- js异步请求
目前async / await特性并没有被添加到ES2016标准中,但不代表这些特性将来不会被加入到Javascript中.在我写这篇文章时,它已经到达第三版草案,并且正迅速的发展中.这些特性已经被I ...
- 如何在网页中浏览和编辑DWG文件 梦想CAD控件
如何在网页中浏览和编辑DWG文件 梦想CAD控件 www.mxdraw.com 梦想绘图控件5.2 是国内最强,最专业的CAD开发组件(控件),不需要AutoCAD就能独立运行.控件使用VC 201 ...
- Redis系列(七)--Sentinel哨兵模式
在上一篇文章了解了主从复制,主从复制本身的容错性很差,一旦master挂掉,只能进行手动故障转移,很难完美的解决这个问题 而本文讲解的sentinel可以解决这个问题 Redis sentinel示意 ...
- 使用JS获取request参数
1.document.write('<%=request.getAttribute("param")%>'); 2.window.navigator.userAgent ...
- Python基础(三) 数据类型
我们首先要看的是几乎任何语言都具有的数据类型,包括字符串.整型.浮点型以及布尔类型.这些基本数据类型组成了基本控制块,从而创建的Python应用程序. 一.基本结构 1.数值: Python支持不同的 ...
- c# 缓存!
做项目的时候获取所有城市的时候,发现每次去获取都花费了很多时间,所以用缓存方法让效率更高! 这是我做的例子,如下: public class CacheGetCity { /// <summar ...
- HDU 5291 Candy Distribution
Candy Distribution Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Other ...