基于Python的大数据的分页模型代码
最近在写一个cmdb系统的分页,尽管Django本身有分页的模块儿,但是还是想实现一下自己心中想的分页的一种逻辑
因为,在我们工作当中,当我们的数据量超级大的时候,其实我们每次分页查询都不必将所有的数据查询出来,而是可以按阶段的查询,举个例子
每次查询5页数据,当需要第六页的时候,再次进行加载,为了更加明了,做了举例
首先我们规定好每次查询5页,每页4条数据
db_data = list(range(1,100)) final_page = len(db_data) one_page_num = 5 #每页4条
one_time_num = 5 #每次查5页
1、查询索引的逻辑 设定findIndex查询的索引
# page = 1 int(1/5) + 1 findIndex = 1
# page = 2 int(2/5) + 1 findIndex = 1
# page = 3 int(3/5) + 1 findIndex = 1
# page = 4 int(4/5) + 1 findIndex = 1
# page = 5 int(5/5) findIndex = 1
# page = 6 int(6/5) + 1 findIndex = 2
# page = 7 int(7/5) + 1 findIndex = 2
# page = 8 int(8/5) + 1 findIndex = 2
# page = 9 int(9/5) + 1 findIndex = 2
# page = 10 int(10/5) findIndex = 2
# page = 11 int(11/5) + 1 findIndex = 3
# page = 12 int(12/5) + 1 findIndex = 3
# page = 13 int(13/5) + 1 findIndex = 3
# page = 14 int(14/5) + 1 findIndex = 3
# page = 15 int(15/5) findIndex = 3
所以我们可以写如下代码
if page/one_time_num > int(page/one_time_num):
findIndex = int(page / one_time_num) + 1
else:
findIndex = int(page / one_time_num)
#进行第一次查询,查询每次5页,每页4条的数据
select_num = one_time_num * one_page_num #这里决一次定查询20条
select_start = (findIndex - 1) * select_num # 开始查询的索引
select_down = findIndex * select_num # 结束查询的索引
select_data = db_data[select_start: select_down] #这里查询出了一次20条数据
这个时候是查询出20条数据了,但是,我们想要的具体的数据和页码对不上,所以做了以下的数据
#下面对20条数据进行截取
#findIndex 1
# page = 1 1-(0*5) gnPage = 1
# page = 2 2-(0*5) gnPage = 2
# page = 3 3-(0*5) gnPage = 3
# page = 4 4-(0*5) gnPage = 4
# page = 5 5-(0*5) gnPage = 5
#findIndex 2
# page = 6 6-(1*5) gnPage = 1
# page = 7 7-(1*5) gnPage = 2
# page = 8 8-(1*5) gnPage = 3
# page = 9 9-(1*5) gnPage = 4
# page = 10 10-(1*5) gnPage = 5
#findIndex 3
# page = 11 11-(2*5) gnPage = 1
# page = 12 12-(2*5) gnPage = 2
# page = 13 13-(2*5) gnPage = 3
# page = 14 14-(2*5) gnPage = 4
# page = 15 15-(2*5) gnPage = 5
所以我们可以得到以下代码来获取具体的一页数据
#设定 截取的索引位now_index
now_index = page - (findIndex-1)*one_time_num
#设定单页的截取起始
page_start = (now_index - 1) * one_page_num
page_end = now_index * one_page_num
#开始截取
page_data = select_data[page_start:page_end]
最后进行代码结合
#coding:utf-8 db_data = list(range(1,100)) one_page_num = 5 #每页4条
one_time_num = 5 #每次查5页 while True:
page = int(input("page >>>")) #输入页码 #查询索引的逻辑 设定findIndex查询的索引
# page = 1 int(1/5) + 1 findIndex = 1
# page = 2 int(2/5) + 1 findIndex = 1
# page = 3 int(3/5) + 1 findIndex = 1
# page = 4 int(4/5) + 1 findIndex = 1
# page = 5 int(5/5) findIndex = 1
# page = 6 int(6/5) + 1 findIndex = 2
# page = 7 int(7/5) + 1 findIndex = 2
# page = 8 int(8/5) + 1 findIndex = 2
# page = 9 int(9/5) + 1 findIndex = 2
# page = 10 int(10/5) findIndex = 2
# page = 11 int(11/5) + 1 findIndex = 3
# page = 12 int(12/5) + 1 findIndex = 3
# page = 13 int(13/5) + 1 findIndex = 3
# page = 14 int(14/5) + 1 findIndex = 3
# page = 15 int(15/5) findIndex = 3 if page/one_time_num > int(page/one_time_num):
findIndex = int(page / one_time_num) + 1
else:
findIndex = int(page / one_time_num)
#进行第一次查询,查询每次5页,每页4条的数据
select_num = one_time_num * one_page_num #这里决一次定查询20条
select_start = (findIndex - 1) * select_num # 开始查询的索引
select_down = findIndex * select_num # 结束查询的索引 select_data = db_data[select_start: select_down] #这里查询出了一次20条数据 #下面对20条数据进行截取
#findIndex 1
# page = 1 1-(0*5) gnPage = 1
# page = 2 2-(0*5) gnPage = 2
# page = 3 3-(0*5) gnPage = 3
# page = 4 4-(0*5) gnPage = 4
# page = 5 5-(0*5) gnPage = 5
#findIndex 2
# page = 6 6-(1*5) gnPage = 1
# page = 7 7-(1*5) gnPage = 2
# page = 8 8-(1*5) gnPage = 3
# page = 9 9-(1*5) gnPage = 4
# page = 10 10-(1*5) gnPage = 5
#findIndex 3
# page = 11 11-(2*5) gnPage = 1
# page = 12 12-(2*5) gnPage = 2
# page = 13 13-(2*5) gnPage = 3
# page = 14 14-(2*5) gnPage = 4
# page = 15 15-(2*5) gnPage = 5
#设定 截取的索引位now_index
now_index = page - (findIndex-1)*one_time_num
#设定单页的截取起始
page_start = (now_index - 1) * one_page_num
page_end = now_index * one_page_num
#开始截取
page_data = select_data[page_start:page_end]
#输出效果
print("+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++")
print("当前是第%s次查询"%findIndex)
print("当前查询到的所有数据是 \n %s" % select_data)
print("当前是 %s 页" % page)
print("当前的数据是 \n %s " % page_data)
print("+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++")
大家试一下吧。
基于Python的大数据的分页模型代码的更多相关文章
- MySQL大数据量分页查询方法及其优化
MySQL大数据量分页查询方法及其优化 ---方法1: 直接使用数据库提供的SQL语句---语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N---适 ...
- 大数据实时处理-基于Spark的大数据实时处理及应用技术培训
随着互联网.移动互联网和物联网的发展,我们已经切实地迎来了一个大数据 的时代.大数据是指无法在一定时间内用常规软件工具对其内容进行抓取.管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的 ...
- 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)
不多说,直接上干货! Impala和Hive的关系(详解) 扩展博客 给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 参考 horton ...
- 【Python开发】Python 适合大数据量的处理吗?
Python 适合大数据量的处理吗? python 能处理数据库中百万行级的数据吗? 处理大规模数据时有那些常用的python库,他们有什么优缺点?适用范围如何? 需要澄清两点之后才可以比较全面的看这 ...
- Python/Numpy大数据编程经验
Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. ...
- Access大数据高效分页语句
Access大数据高效分页语句 oracle的分页查询可以利用rowid伪列. db2的分页查询可以利用row_number() over()聚合函数. mysql有limit. access仿佛先天 ...
- 高速基于echarts的大数据可视化
[Author]: kwu 高速基于echarts的大数据可视化,echarts纯粹的js实现的图表工具.高速开发的过程例如以下: 1.引入echarts的依赖js库 <script type= ...
- 软工之词频统计器及基于sketch在大数据下的词频统计设计
目录 摘要 算法关键 红黑树 稳定排序 代码框架 .h文件: .cpp文件 频率统计器的实现 接口设计与实现 接口设计 核心功能词频统计器流程 效果 单元测试 性能分析 性能分析图 问题发现 解决方案 ...
- 黑马基础阶段测试题:创建一个存储字符串的集合list,向list中添加以下字符串:”C++”、”Java”、” Python”、”大数据与云计算”。遍历集合,将长度小于5的字符串从集合中删除,删除成功后,打印集合中的所有元素
package com.swift; import java.util.ArrayList; import java.util.List; import java.util.ListIterator; ...
随机推荐
- 关于调用接口 Connection reset 问题(使用代理调接口)
之前调用过别的公司的接口上传数据,但是遇到个问题就是Connection reset,查阅了网上的各种资料,说什么的都有,主要意思就是说发布接口和调用接口的某些配置不一样,但是这个怎么说呢,单方面没办 ...
- 「AT4741 [ABC132D] Blue and Red Balls」
题目大意 给出一个长度为 \(N\) 的01串,其中有 \(K\) 个 \(1\),其他都是 \(0\),需要求出当着 \(K\) 个 \(1\) 分成 \(1\) 到 \(K\) 段每一个的方案数. ...
- Linux 命令中 find 和 xargs 命令的用法
find 命令(一) find 命令主要作用是沿着文件层次结构向下遍历,匹配符合条件的文件,并执行相应的操作.Linux 下 find 命令提供了相当多的查找条件,功能很强大,对应的学习难度也比较大. ...
- nginx windows下重新加载配置
运行过程中,有个节点部分服务出现故障,像将其下线修复, 使用nginx -t; nginx -s reload 重新加载配置 得到错误"nginx: [error] OpenEvent(&q ...
- HTML中的ul标签
UL格式: <ul> <li>Coffee</li> <li>Tea</li> <li>Milk</li> < ...
- 从npz文件中读取图片并显示的小例子
前提:我把自己的数据集存成了npz的形式,也就是npy的压缩形式.如果电脑上安装了解压软件,双击npz文件的话,会出现每一部分压缩文件的名字例如npz文件的名称为:mnist.npz文件,用好压解压软 ...
- MySQL之关系
目录 关系 多对多的关系,如何通过mysql来表示 一对一关系 关系 多对多的关系,如何通过mysql来表示 站在老师的角度 一个老师可以教多个学生, 一个老师也可以教一个学生. 站在学生的角度 一个 ...
- 【转】CGI 和 FastCGI 协议的运行原理
介绍 深入CGI协议 CGI的运行原理 CGI协议的缺陷 深入FastCGI协议 FastCGI协议运行原理 为什么是 FastCGI 而非 CGI 协议 CGI 与 FastCGI 架构 再看 Fa ...
- 模拟服务容器Ioc
服务容器是一个用于管理类依赖和执行依赖注入的强大工具. 一个类要被容器所能够提取,必须要先注册至这个容器.既然称这个容器叫做服务容器,那么我们需要某个服务,就得先注册.绑定这个服务到容器,那么提供服务 ...
- Java记录2---包的使用
javac -d . A.java -d 表示自动生成包层 . 表示这个包层在当前目录下建立 package link.roland;//package 语句必须是第一条语句 //该语句表示把该文件中 ...