Python 基于pymongo操作Mongodb学习总结
实践环境
Python 3.6.4
pymongo 4.1.1
pymongo-3.12.3-cp36-cp36m-win_amd64.whl
下载地址:https://pypi.org/simple/pymongo/
代码实践
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import datetime
import random
import pymongo
from pymongo import MongoClient
from bson.objectid import ObjectId
# # # # # # # # # 建立连接
# 方式1
# client = MongoClient() # 使用默认主机和端口连接本地Mongodb服务器
# 方式2:
# client = MongoClient("localhost", 27017) # 也可以手动指定服务器和端口
# 方式3:采用url
user_name = 'tcems'
password = 'Password123456'
uri = f'mongodb://{user_name}:{password}@polartcems-mrs1.dbsit.sfcloud.local:24000,polartcems-mrs2.dbsit.sfcloud.local:24000,polartcems-mrs3.dbsit.sfcloud.local:24000'
client = MongoClient(uri)
# # # # # # # # # 获取数据库信息
databases = client.list_databases()
for database in databases:
print(database) # 输出字典,形如:{'name': 'custom_db_name', 'sizeOnDisk': 5001216.0, 'empty': False}
# # # # # # # # # 获取数据库
my_test_db = client.tcems
# my_test_db = client['tcems'] # 如果不支持.属性方式访问(比如test-db),可以考虑使用字典方式访问
# # # # # # # # # 获取当前数据库拥有的集合名称列表
collections = my_test_db.list_collection_names()
print(collections) # 输出名称列表,形如['YiLiuTemHumLog', 'test_collection', ...]
# # # # # # # # # 获取集合
collection = my_test_db.test_collection
# collection = my_test_db['test_collection'] # 如果不支持.属性方式访问(比如test-db),可以考虑使用字典方式访问
# # # # # # # # # 索引
# 创建索引
# collection.create_index([("date", pymongo.ASCENDING)])
# collection.create_index([("field_name", pymongo.ASCENDING)], unique=True) # 创建唯一索引
# # # # # # # # # 集合文档操作
# # # # # # # # # 插入文档
# 逐条插入文档
post = {
'author': 'Mike',
'visitor_num': random.randint(0,100),
'text': 'blog post of Mike!',
'tags': ['mongodb', 'python', 'pymongo'],
'date': datetime.datetime.now(tz=datetime.timezone.utc)
}
post_id = collection.insert_one(post).inserted_id # 注意:insert_one函数返回 pymongo.results.InsertOneResult对象
print(post_id, type(post_id)) # 输出形如:65a881fffa04b0dc0e7a74bc <class 'bson.objectid.ObjectId'> # 注意,获取的insert_id为 bson.objectid.ObjectId类型
try:
post['_id'] = post_id
collection.insert_one(post) # 运行报错: pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection:...
except pymongo.errors.DuplicateKeyError:
print('id重复')
# do something
# 批量插入文档
posts = [
{
'author': 'Mike',
'visitor_num': random.randint(0,100),
'text': 'blog post of Mike!',
'tags': ['mongodb', 'python', 'pymongo'],
'date': datetime.datetime.now(tz=datetime.timezone.utc)
},
{
'author': 'Jack',
'visitor_num': random.randint(0,100),
'text': 'blog post of Jack!',
'tags': ['mongodb', 'python', 'pymongo'],
'date': datetime.datetime.now(tz=datetime.timezone.utc)
}
]
res = collection.insert_many(posts) # insert_many函数返回 pymongo.results.InsertManyResult 对象
print(res.inserted_ids) # 获取插入记录的id,形如 [ObjectId('65a9423b782fc7838d729033'), ObjectId('65a9423b782fc7838d729034')]
inserted_ids = res.inserted_ids
# # # # # # # # # 查询文档
# 查询单条文档
res = collection.find_one() # 注意:如果集合中存在记录,则find_one返回字典对象,否则返回None
print(res, type(res))
print(res.get('_id'), str(res.get('_id'))) # 获取插入时自动生成的文档ID
# 查询时指定查询条件
print(collection.find_one({'author': 'Mike'})) # 文档author必须为Mike
print(collection.find_one({'_id': res.get('_id')})) # 按_id查询
print(collection.find_one({'_id': post_id})) # 注意:_id值类型必须为ObjectId
# 批量查询
# 遍历所有记录
for post in collection.find():
print(post) # 此处,post为字典类型
break
# 只查询满足条件的记录(注意:字典中逗号分隔的多个条件,默认的and关系
for post in collection.find({'visitor_num': {'$gte': 12, '$lte': 18}}): # 查找visitor_num大于等于12小于等于18的文档
print(post)
for post in collection.find({'author': {'$ne': 'Mike'}}): # 查找 author 不等于 Mike的文档
print(post)
for post in collection.find({'visitor_num': {'$ne': None}}): # 查找 visitor_num不为null的文档记录
print(post)
for post in collection.find({'$or':[{'visitor_num':{'$gte':18}},{'author': 'Mike'}]}): # 查找 visitor_num 大于等于18,或者 author 等于 Mike 的文档
print(post)
for post in collection.find({'visitor_num':{'$in': [58, 90, 41]}}): # 查找 visitor_num 值在数组 [58,90,41]中的文档
print(post)
for post in collection.find({'author':{'$nin': ['Mike','Jack']}}): # 查找 visitor_num 不在数组 ['Mike','Jack'] 中的文档
print(post)
# 限制返回文档数
for post in collection.find().limit(10): # 仅返回10条文档
print(post)
# 查询排序
# 单个字段排序
# for post in collection.find().sort('visitor_num'): # 按 visitor_num 升序排序 # 注意:不存在排序字段的文档在有排序字段文档之上
for post in collection.find().sort('visitor_num', pymongo.ASCENDING): # 按 visitor_num 升序排序 pymongo.ASCENDING = 1
print(post)
# 多字段排序
print('多字段排序1: 按 _id 升序,再按 visitor_num 降序')
for post in collection.find().sort([('_id', 1), ('visitor_num', pymongo.DESCENDING)]):
print(post)
print('多字段排序2: 按 _id 降序,再按 visitor_num 升序')
for post in collection.find().sort([('_id', -1), ('visitor_num', 1)]):
print(post)
# 聚合查询
start_time = datetime.datetime(2024, 1, 15, 6, 37, 37, 246000)
end_time = datetime.datetime(2024, 1, 15, 6, 44, 7, 239000)
# 查询当前集合中最大,最小文档ID
for record in collection.aggregate([
{
"$group": {
"_id": None,
"min_id": {"$min": '$_id'},
"max_id": {"$max": '$_id'}
}
}
]):
if record: # record为字典类型
print(record.get('min_id'))
print(record.get('max_id'))
# 查询当前集合中指定时间范围内最大,最小文档ID
for record in collection.aggregate([
{
'$match': {
'date': {'$gte': start_time, '$lte': end_time}},
},
{
"$group": {
"_id": None,
"min_id": {"$min": '$_id'},
"max_id": {"$max": '$_id'}
}
}
]):
if record: # record为字典类型
print(record.get('min_id'))
print(record.get('max_id'))
# 聚合管道
# 查询文档,按visitor_num降序排序,限制返回文档数为10--获取visitor_num top 10的记录
for post in collection.find().sort('visitor_num', pymongo.DESCENDING).limit(10):
print(post)
# 或者
for post in collection.find().limit(10).sort('visitor_num', pymongo.ASCENDING):
print(post)
# 分页查询
for post in collection.find().skip(5).limit(10): # skip(N) 跳过前N个文档,等价于mysql查询中的offset 根据limit参数值,返回第N+1条及往后文档
print(post)
# 统计
# 获取文档总数
print(collection.count_documents({})) # 获取文档总数 # 注意:查询条件 {} 不能少,否则会报错
print(collection.count_documents({'author': 'Jack'})) # 获取author值为Jack的文档总数
# 获取最小值
min_visitor_num = collection.find_one(sort=[('visitor_num', pymongo.ASCENDING)]).get('visitor_num') # 获取最小 visitor_num
print('min_visitor_num', min_visitor_num)
# 获取最大值
max_visitor_num = collection.find_one(sort=[('visitor_num', pymongo.DESCENDING)]).get('visitor_num') # 获取最大 visitor_num
print(collection.find_one(sort=[('visitor_num', pymongo.DESCENDING)]))
# # # # # # # # # 更新文档
# 逐条更新
new_content = {
'author': 'Json',
'visitor_num': random.randint(0,100),
'text': 'blog post of Json!',
'tags': ['mongodb', 'python', 'pymongo'],
'date': datetime.datetime.now(tz=datetime.timezone.utc)
}
query_condition = {'_id': ObjectId('65a4d2b165b14a57a38a1504')}
collection.update_one(query_condition, {'$set': new_content})
print(collection.find_one({'_id': ObjectId('65a4d2b165b14a57a38a1504')})) # 查看更新后的文档
# 批量更新
query_condition = {'visitor_num': None}
collection.update_many(query_condition, {'$set': new_content}) # 批量更新visitor_num值为null的的文档内容为 new_content变量值
# # # # # # # # # 删除文档
# 逐条删除文档
res = collection.delete_one({'_id': post_id}) # 删除指定_id等于 post_id变量值的文档 # 注意:delete_one函数返回 pymongo.results.DeleteResult对象
# print(res.deleted_count, res.raw_result)
if res.deleted_count == 1:
print('删除成功')
# 批量删除
res = collection.delete_many({'_id': {'$in': inserted_ids}}) # delete_many函数返回 pymongo.results.DeleteResult 对象
print(res.deleted_count) # 输出被删除文档数量
# 删除全部文档
collection.delete_many({})
# # # # # # # # # 删除集合
collection.drop()
说明:
如果连接用户名和密码包含诸如
':','/','+'及'@'保留字符,则使用前应该先进行编码,如下:from urllib.parse import quote_plus user_name = quote_plus('@username')
password = quote_plus('test_password+')
host = 'project.example.local'
port = 27017
uri = f'mongodb://{user_name}:{password}@{host}:{port}'
client = MongoClient(uri)
使用URI建立连接时,URI书写格式分这么几种情况:
需要验证密码
uri = 'mongodb://user_name:password@host:port/authentication_database'
说明:
authentication_database:授权数据库,可选配,默认admin,如果不为admin时,必须显示指明,否则会报类似如下错误:pymongo.errors.OperationFailure: Authentication failed., full error: {'ok': 0.0, 'errmsg': 'Authentication failed.', 'code': 18, 'codeName': 'AuthenticationFailed'}
不需要密码验证
uri = 'mongodb://host:port'
集群模式
uri = 'mongodb://user_name:password@host1:port1,host2:port2,host3:port3,...hostN:portN/authentication_database'
MongoDB中的集合和数据库,都是懒惰地创建的——在第一个文档插入其中时创建的。
备注:笔者实践时发现,无法自动创建数据库和集合,会提示授权认证失败。
MongoDB中的数据使用JSON样式的文档表示(和存储)。在PyMongo中,使用字典来表示文档。例如,以下字典可能用于表示博客文章:
import datetime
post = {
"author": "Mike",
"text": "My first blog post!",
"tags": ["mongodb", "python", "pymongo"],
"date": datetime.datetime.now(tz=datetime.timezone.utc),
}
注意,文档可以包含本地Python类型(如
datetime.datetime实例),这些类型将自动转换为相应的BSON类型或从相应的BSON类型转换。实践时遇到类似如下错误:
pymongo.errors.ConfigurationError: Server at * reports wire version 5, but this version of PyMongo requires at least 6 (MongoDB 3.6).
原因分析:
错误信息提示来看,使用的PyMongo版本与MongoDB服务器的Wire版本不兼容。服务器wire版本为5,而该PyMongo要求至少wire版本6(MongoDB 3.6)
解决方法:
升级MongoDB服务器:将MongoDB服务器升级到PyMongo所需的版本,即MongoDB 3.6或更高版本。
降级PyMongo版本:如果不能升级MongoDB服务器,可以尝试降级PyMongo版本,以匹配MongoDB服务器版本。
笔者实践时选择了降低PyMongo版本为 pymongo-3.12.3-cp36-cp36m-win_amd64.whl
参考链接
https://pymongo.readthedocs.io/en/stable/tutorial.html
https://pymongo.readthedocs.io/en/stable/api/pymongo/cursor.html#pymongo.cursor.Cursor.sort
https://www.mongodb.com/docs/manual/reference/operator/query/
https://www.mongodb.com/docs/manual/reference/operator/aggregation/
https://www.mongodb.com/docs/manual/reference/operator/aggregation-pipeline/
Python 基于pymongo操作Mongodb学习总结的更多相关文章
- python操作三大主流数据库(8)python操作mongodb数据库②python使用pymongo操作mongodb的增删改查
python操作mongodb数据库②python使用pymongo操作mongodb的增删改查 文档http://api.mongodb.com/python/current/api/index.h ...
- Python 使用pymongo操作mongodb库
Python 使用pymongo操作mongodb库 2016-12-31 21:55 1115人阅读 评论(0) 收藏 举报 分类: - - - Python(10) 版权声明:本文为博主原创文 ...
- python 通过pymongo操作mongoDB执行sort
在mongo shell 中对数据进行排序操作的时候 db.getCollection('ANJUKE_PRICE').find({},{'id':1,'_id':0}).sort({'id':1}) ...
- PHP操作MongoDB学习笔记
<?php/*** PHP操作MongoDB学习笔记*///*************************//** 连接MongoDB数据库 **////*************** ...
- MongoDB学习【四】—pymongo操作mongodb数据库
一.pymongodb的安装 Python 要连接 MongoDB 需要 MongoDB 驱动,这里我们使用 PyMongo 驱动来连接. pip安装 pip 是一个通用的 Python 包管理工具, ...
- python使用pymongo访问MongoDB的基本操作,以及CSV文件导出
1. 环境. Python:3.6.1 Python IDE:pycharm 系统:win7 2. 简单示例 import pymongo # mongodb服务的地址和端口号mongo_url = ...
- PHP操作MongoDB学习(转)
1 mongodb启动时,设置启动项 C:\>mongodb\bin\mongod --config C:\mongodb.conf 其中mongodb.conf为: dbpath = ...
- pymongo操作mongodb
此验证中只开启两个mongodb节点,可以连接任意节点,以下操作不涉及读写,不涉及连接那个节点 mongodb连接: from pymongo import MongoReplicaSetClient ...
- Python操作MongoDB看这一篇就够了
MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,它的字段值可以包含其他文档.数组及文档数组,非常灵活.在这一节中,我们就来看 ...
- python操作mongodb
# python操作mongodb # 首先,引入第三方模块pymongo,该模块是python用来操作mongodb的 import pymongo # 第二步,设置ip地址,以及表格名称,表格名字 ...
随机推荐
- 基于Ubuntu20.04在k8s 1.25部署gin+MySQL服务
0. 前言 某天突发奇想,既然都学了 docker 了,那干脆,顺便把 kubernetes 也学了,于是开始了我长达一个月的环境搭建.踩坑历程. 最开始,我的想法是,在我的物理机使用 WSL + d ...
- Xenocode Postbuild——C#代码混淆器使用方法
安装 不多作赘述 使用步骤 选择[application]选项卡,选择[add],如果添加的是exe,则[Preset]选择第一项,添加的是dll则选择第二项 选择[Protect]选项卡,将两个都勾 ...
- liunx查看nginx 进程
ChatGPT4.0国内站点: https://www.weijiwangluo.com/talk 要查看nginx进程,可以使用以下命令: ps -ef | grep nginx 这个命令会列出当前 ...
- Vue学习:4.v-model使用
第一节算是对v-model的粗略了解,仅仅是将input的输入与Vue 实例的数据之间双向绑定.这一节将更详细的了解v-model在不同表单元素中的使用. v-model实例:找对象 实现功能: 使用 ...
- 安装Ingress-Nginx
目前,DHorse(https://gitee.com/i512team/dhorse)只支持Ingress-nginx的Ingress实现,下面介绍Ingress-nginx的安装过程. 下载安装文 ...
- 微信小程序自动化分析_包含执行设备及对应的微信版本
背景介绍: 微信小程序是基于腾讯自研 X5 内核,不是谷歌原生 webview. 实现方式: 1.小程序自动化sdk,使用自动化sdk,需要有小程序的开发者权限,以及参考的资料较少,2.选择采用app ...
- SpringBoot 3.x 结合 Swagger3 (Knife4j )踩坑实录
SpringBoot 3.x + Swagger3 踩坑实录 我的是springboot 版本是:3.2.2 <parent> <groupId>org.springframe ...
- C++之printf函数
背景 C++中可以使用cout来输出. 但是cout输出一些格式化的数据非常麻烦. 比如: hour,min和sec代表当前时间,需求:按12:00:00格式输出当前时间. //使用cout输出 co ...
- 2019徐州区域赛 ACEFM 题解 & pollard-rho & miller-rabin & 求出每个子树的重心 板子
A. Cat 题目大意:你需要在 [L , R] 选取连续的一段,使得这一段的异或和小于给定的数 S. 请求出最长的长度. 做法:我们可以发现 \[(2k) \oplus (2k+1) = 1, (2 ...
- Redis八股文(大厂面试真题)
号:tutou123com我是小宋编码,Java程序员 ,只熬夜但不秃头. 关注我,带你轻松过面试.提升简历亮点如果你觉得对你有帮助,欢迎关注[1] 内容目录 1.说说redis,了解redis源码 ...