单线程

500+w条数据,插入时间:1小时,13分钟。

脚本:

[root@10 hurl]# cat insert-mongo2.py

#!/usr/bin/env python

#coding=utf-8

import time,datetime

import pymongo

from pymongo import MongoClient

client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')

db = client.test

#from pymongo import Connection

#connection = Connection('127.0.0.1', 27017)

#db = connection['test']

#时间记录器

def func_time(func):

def _wrapper(*args,**kwargs):

start = time.time()

func(*args,**kwargs)

print func.__name__,'run:',time.time()-start

return _wrapper

@func_time

def insert(num):

posts = db.userinfo

for x in range(num):

post = {"_id" : str(x),

"author": str(x)+"Mike",

"description1":"this is a very long description for " + str(x),

"description2":"this is a very long description for " + str(x),

"description3":"this is a very long description for " + str(x),

"description4":"this is a very long description for " + str(x),

"description5":"this is a very long description for " + str(x),

"text": "My first blog post!",

"tags": ["mongodb", "python", "pymongo"],

"date": datetime.datetime.utcnow()}

posts.insert_one(post)

if x%100000 == 0:

print "100000 !  --  %s"%(datetime.datetime.now())

if __name__ == "__main__":

#设定循环1000万次

num = 10000000

insert(num)

插入总数:

mongos> db.userinfo.count()

5033914

mongos>

多进程并发:

测试脚本:

[root@10 hurl]# cat insert-mongo3.py

#!/usr/bin/env python

#coding=utf-8

import multiprocessing,random,string

import time,datetime

import pymongo

from pymongo import MongoClient

def gen_load(x,taskid):

client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')

db = client.test

posts = db.userinfo2

for x in range(1000000):

post = {"_id" : str(x),

"author": str(x)+"Mike",

"text": "My first blog post!",

"tags": ["mongodb", "python", "pymongo"],

"date": datetime.datetime.utcnow()}

posts.insert_one(post)

if x%100000 == 0:

print "100000 !  --  %s"%(datetime.datetime.now())

if __name__ == '__main__':

inser_number=2500

pro_pool = multiprocessing.Pool(processes=100)

print time.strftime('%Y-%m-%d:%H-%M-%S',time.localtime(time.time()))

start_time=time.time()

manager = multiprocessing.Manager()

for i in xrange(10):

taskid=i

pro_pool.apply_async(gen_load,args=(inser_number,taskid))

pro_pool.close()

pro_pool.join()

elapsed = time.time()-start_time

print elapsed

time.sleep(1)

print "Sub-process(es) done."

10w条数据插入

100个线程,10w条数据,86秒

[root@10 hurl]# python insert-mongo3.py

2015-12-08:13-54-53

10000 !  --  2015-12-08 13:54:53.822510

10000 !  --  2015-12-08 13:55:02.329206

10000 !  --  2015-12-08 13:55:10.624850

10000 !  --  2015-12-08 13:55:19.763308

10000 !  --  2015-12-08 13:55:28.384718

10000 !  --  2015-12-08 13:55:36.957917

10000 !  --  2015-12-08 13:55:45.426113

10000 !  --  2015-12-08 13:55:53.872843

10000 !  --  2015-12-08 13:56:02.898263

10000 !  --  2015-12-08 13:56:11.243706

86.4502689838

Sub-process(es) done.

100个进程:

[root@10 hurl]# ps -ef| grep python | wc -l

103

100w条数据:

100个线程,100w条数据,858秒:

[root@10 hurl]# python insert-mongo3.py

2015-12-08:14-04-21

100000 !  --  2015-12-08 14:04:21.481368

100000 !  --  2015-12-08 14:05:43.069700

100000 !  --  2015-12-08 14:07:05.694774

100000 !  --  2015-12-08 14:08:28.375586

100000 !  --  2015-12-08 14:09:51.335589

100000 !  --  2015-12-08 14:11:18.619572

100000 !  --  2015-12-08 14:12:45.748144

100000 !  --  2015-12-08 14:14:12.534341

100000 !  --  2015-12-08 14:15:43.059457

100000 !  --  2015-12-08 14:17:11.387942

858.129628897

Sub-process(es) done.

[root@10 hurl]#

查询:

在500w条数据中随机查询100w次,用时15秒。

[root@10 hurl]# python find-mongo2.py

find 0 .

find 100000 .

find 200000 .

find 300000 .

find 400000 .

find 500000 .

find 600000 .

find 700000 .

find 800000 .

find 900000 .

mread run: 15.3293960094

[root@10 hurl]#

脚本:

[root@10 hurl]# cat find-mongo2.py

#!/usr/bin/env python

#coding=utf-8

import time,datetime

import random

import pymongo

from pymongo import MongoClient

client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')

db = client.test

def func_time(func):

def _wrapper(*args,**kwargs):

start = time.time()

func(*args,**kwargs)

print func.__name__,'run:',time.time()-start

return _wrapper

#@func_time

def randy():

rand = random.randint(1,5000000)

return rand

@func_time

def mread(num):

find = db.userinfo

for i in range(num):

rand = randy()

#随机数查询

find.find({"author": str(rand)+"Mike"})

if i%100000 == 0:

print "find %s ."%i

if __name__ == "__main__":

#设定循环100万次

num = 1000000

mread(num)

无索引Update

在500w数据中,无索引update100条数据,567秒:

[root@10 hurl]# python update-mongo2.py

mread run: 567.210422993

[root@10 hurl]#

脚本:

[root@10 hurl]# cat update-mongo2.py

#!/usr/bin/env python

#coding=utf-8

import time,datetime

import random

import pymongo

from pymongo import MongoClient

client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')

db = client.test

def func_time(func):

def _wrapper(*args,**kwargs):

start = time.time()

func(*args,**kwargs)

print func.__name__,'run:',time.time()-start

return _wrapper

#@func_time

def randy():

rand = random.randint(1,5000000)

return rand

@func_time

def mread(num):

update = db.userinfo

for i in range(num):

rand = randy()

name = str(rand)+"Mike"

#随机数查询

print "uodate %s  "%name

update.update_one({"author": name},{"$set":{"text":"My second blog post!"}})

if __name__ == "__main__":

#设定循环

num = 100

mread(num)

Create index

500w条数据,创建索引,用时70秒。

[root@10 hurl]# python index-mongo2.py

insert run: 70.6546721458

脚本:

[root@10 hurl]# vi index-mongo2.py

#!/usr/bin/env python

#coding=utf-8

import time,datetime

import pymongo

from pymongo import MongoClient

client = MongoClient('mongodb://test:test123@172.16.100.26:27019/test')

db = client.test

#时间记录器

def func_time(func):

def _wrapper(*args,**kwargs):

start = time.time()

func(*args,**kwargs)

print func.__name__,'run:',time.time()-start

return _wrapper

@func_time

def createInx(num):

posts = db.userinfo

posts.create_index('author', unique=True)

if __name__ == "__main__":

#设定循环

num = 1

createInx(num)

有索引Update

在500w数据中,有索引update100条数据,1.98秒:

[root@10 hurl]# python update-mongo2.py

mread run: 1.98181605339

[root@10 hurl]#

Delete

500w条数据,删除完成,使用时间:541.97秒。

[root@10 hurl]# python delete-mongo2.py

count before remove: 5033914

count after remove: 0

insert run: 541.965857983

脚本:

[root@linux-00 sh]# python delete-mongo2.py

count before remove: 100000

count after remove: 0

remove run: 0.951205015182

[root@linux-00 sh]# cat delete-mongo2.py

#!/usr/bin/env python

import time,datetime

import pymongo

from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017/')

db = client.test

def func_time(func):

def _wrapper(*args,**kwargs):

start = time.time()

func(*args,**kwargs)

print func.__name__,'run:',time.time()-start

return _wrapper

@func_time

def remove():

posts = db.userinfo

print 'count before remove:',posts.count();

posts.delete_many({});

print 'count after remove:',posts.count();

if __name__ == "__main__":

remove()

总结:

单进程

多进程

多进程

单进程

数据量

500w

10w

100w

500w

操作

insert

insert

insert

Find 100w次

用时

1小时13分钟

86秒

858秒

15秒

平均(条/秒)

1141.55

1162.79

1165.50

66666.67

注:我自己电脑上的虚拟机插入测试,单线程,10w条数据,用时30秒,平均3333条每秒

数据量

500w

500w

500w

500w

索引

无索引

有索引

操作

Update100条数据

Update100条数据

创建索引

delete

用时

567秒

1.98秒

70.65

541.97秒

平均(条/秒)

0.1764

50.51

70771.41

9225.60

Mongo性能测试-python脚本的更多相关文章

  1. python脚本批量生成数据

    在平时的工作中,经常会遇到造数据,特别是性能测试的时候更是需要大量的数据.如果一条条的插入数据库或者一条条的创建数据,效率未免有点低.如何快速的造大量的测试数据呢?在不熟悉存储过程的情况下,今天给大家 ...

  2. 如何在python脚本开发做code review

    在软件项目开发中,我们经常提到一个词“code review”.code review中文翻译过来就是代码评审或复查,简而言之就是编码完成后由其他人通过阅读代码来检查代码的质量(可编译.可运行.可读. ...

  3. freeswitch嵌入python脚本

    操作系统:debian8.5_x64 freeswitch 版本 : 1.6.8 python版本:2.7.9 开启python模块 安装python lib库 apt-get install pyt ...

  4. python脚本后台运行

    问题描述: 环境: CentOS6.4 一个用python写的监控脚本test1.py,用while True方式一直运行,在ssh远程(使用putty终端)时通过以下命令启动脚本: python t ...

  5. 某互联网后台自动化组合测试框架RF+Sikuli+Python脚本

    某互联网后台自动化组合测试框架RF+Sikuli+Python脚本 http://www.jianshu.com/p/b3e204c8651a 字数949 阅读323 评论1 喜欢0 一.**Robo ...

  6. 动态执行python脚本

    前言 存在许多独立的python脚本,这些脚本可能会增加,也可能会减少,现在需要按照某种顺序调度这些程序.在python的standard library中,有一个模块imp可以实现动态的调用ptho ...

  7. 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本

    摘自:http://blog.csdn.net/forandever/article/details/5711319 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本 ...

  8. SecureCRT中python脚本编写

    SecureCRT中python脚本编写学习指南 SecureCRT python 引言 在测试网络设备中,通常使用脚本对设备端进行配置和测试以及维护:对于PE设备的测试维护人员来说使用较多是Secu ...

  9. Python脚本配合Linux计划任务工作

    经常遇到直接运行Python脚本没有问题,但是一放入/etc/crontab之后就歇菜的情况,总结了一下,大致需要注意以下几点: 1. 脚本首行加入#!/usr/bin/env python 2. 脚 ...

随机推荐

  1. HDU_6017_Girls love 233_(dp)(记忆化搜索)

    Girls Love 233  Accepts: 30  Submissions: 218  Time Limit: 2000/1000 MS (Java/Others)  Memory Limit: ...

  2. Java学习4_一些基础4_输入输出_16.5.7

    读取输入: 想从控制台进行输入,首先需要构造一个Scanner对象,并与“标准输入流”System.in关联. Scanner in=new Scanner(System.in); String na ...

  3. Jmeter之计数器

    如果需要引用的数据量较大,且要求不能重复或者需要自增,那么可以使用计数器来实现. 计数器(counter):允许用户创建一个在线程组之内都可以被引用的计数器. 计数器允许用户配置一个起点,一个最大值, ...

  4. js异步请求

    目前async / await特性并没有被添加到ES2016标准中,但不代表这些特性将来不会被加入到Javascript中.在我写这篇文章时,它已经到达第三版草案,并且正迅速的发展中.这些特性已经被I ...

  5. 如何在网页中浏览和编辑DWG文件 梦想CAD控件

    如何在网页中浏览和编辑DWG文件 梦想CAD控件 www.mxdraw.com 梦想绘图控件5.2  是国内最强,最专业的CAD开发组件(控件),不需要AutoCAD就能独立运行.控件使用VC 201 ...

  6. Redis系列(七)--Sentinel哨兵模式

    在上一篇文章了解了主从复制,主从复制本身的容错性很差,一旦master挂掉,只能进行手动故障转移,很难完美的解决这个问题 而本文讲解的sentinel可以解决这个问题 Redis sentinel示意 ...

  7. 使用JS获取request参数

    1.document.write('<%=request.getAttribute("param")%>'); 2.window.navigator.userAgent ...

  8. Python基础(三) 数据类型

    我们首先要看的是几乎任何语言都具有的数据类型,包括字符串.整型.浮点型以及布尔类型.这些基本数据类型组成了基本控制块,从而创建的Python应用程序. 一.基本结构 1.数值: Python支持不同的 ...

  9. c# 缓存!

    做项目的时候获取所有城市的时候,发现每次去获取都花费了很多时间,所以用缓存方法让效率更高! 这是我做的例子,如下: public class CacheGetCity { /// <summar ...

  10. HDU 5291 Candy Distribution

    Candy Distribution Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Other ...