基于Python的大数据的分页模型代码

最近在写一个cmdb系统的分页，尽管Django本身有分页的模块儿，但是还是想实现一下自己心中想的分页的一种逻辑

因为，在我们工作当中，当我们的数据量超级大的时候，其实我们每次分页查询都不必将所有的数据查询出来，而是可以按阶段的查询，举个例子

每次查询5页数据，当需要第六页的时候，再次进行加载,为了更加明了，做了举例

首先我们规定好每次查询5页，每页4条数据　　

 db_data = list(range(1,100))

 final_page = len(db_data)

 one_page_num = 5 #每页4条

 one_time_num = 5 #每次查5页

1、查询索引的逻辑设定findIndex查询的索引

     # page = 1  int(1/5) + 1  findIndex = 1

     # page = 2  int(2/5) + 1  findIndex = 1

     # page = 3  int(3/5) + 1  findIndex = 1

     # page = 4  int(4/5) + 1  findIndex = 1

     # page = 5  int(5/5)  findIndex = 1

     # page = 6  int(6/5) + 1  findIndex = 2

     # page = 7  int(7/5) + 1  findIndex = 2

     # page = 8  int(8/5) + 1  findIndex = 2

     # page = 9  int(9/5) + 1  findIndex = 2

     # page = 10  int(10/5)  findIndex = 2

     # page = 11  int(11/5) + 1  findIndex = 3

     # page = 12  int(12/5) + 1  findIndex = 3

     # page = 13  int(13/5) + 1  findIndex = 3

     # page = 14  int(14/5) + 1  findIndex = 3

     # page = 15  int(15/5)  findIndex = 3

所以我们可以写如下代码

 if page/one_time_num > int(page/one_time_num):

     findIndex = int(page / one_time_num) + 1

 else:

     findIndex = int(page / one_time_num)

 #进行第一次查询，查询每次5页，每页4条的数据

 select_num = one_time_num * one_page_num #这里决一次定查询20条

 select_start = (findIndex - 1) * select_num  # 开始查询的索引

 select_down =  findIndex * select_num  # 结束查询的索引

 select_data = db_data[select_start: select_down]  #这里查询出了一次20条数据

这个时候是查询出20条数据了，但是，我们想要的具体的数据和页码对不上，所以做了以下的数据

 #下面对20条数据进行截取

     #findIndex 1

         # page = 1  1-(0*5)  gnPage = 1

         # page = 2  2-(0*5)  gnPage = 2

         # page = 3  3-(0*5)  gnPage = 3

         # page = 4  4-(0*5)  gnPage = 4

         # page = 5  5-(0*5)  gnPage = 5

     #findIndex 2

         # page = 6  6-(1*5)  gnPage = 1

         # page = 7  7-(1*5)  gnPage = 2

         # page = 8  8-(1*5)  gnPage = 3

         # page = 9  9-(1*5)  gnPage = 4

         # page = 10  10-(1*5)  gnPage = 5

     #findIndex 3

         # page = 11  11-(2*5)  gnPage = 1

         # page = 12  12-(2*5)  gnPage = 2

         # page = 13  13-(2*5)  gnPage = 3

         # page = 14  14-(2*5)  gnPage = 4

         # page = 15  15-(2*5)  gnPage = 5

所以我们可以得到以下代码来获取具体的一页数据

#设定 截取的索引位now_index

now_index = page - (findIndex-1)*one_time_num

#设定单页的截取起始

page_start = (now_index - 1) * one_page_num

page_end = now_index * one_page_num

#开始截取

page_data = select_data[page_start:page_end]

最后进行代码结合

 #coding:utf-8

 db_data = list(range(1,100))

 one_page_num = 5 #每页4条

 one_time_num = 5 #每次查5页

 while True:

     page = int(input("page >>>"))  #输入页码

     #查询索引的逻辑 设定findIndex查询的索引

     # page = 1  int(1/5) + 1  findIndex = 1

     # page = 2  int(2/5) + 1  findIndex = 1

     # page = 3  int(3/5) + 1  findIndex = 1

     # page = 4  int(4/5) + 1  findIndex = 1

     # page = 5  int(5/5)  findIndex = 1

     # page = 6  int(6/5) + 1  findIndex = 2

     # page = 7  int(7/5) + 1  findIndex = 2

     # page = 8  int(8/5) + 1  findIndex = 2

     # page = 9  int(9/5) + 1  findIndex = 2

     # page = 10  int(10/5)  findIndex = 2

     # page = 11  int(11/5) + 1  findIndex = 3

     # page = 12  int(12/5) + 1  findIndex = 3

     # page = 13  int(13/5) + 1  findIndex = 3

     # page = 14  int(14/5) + 1  findIndex = 3

     # page = 15  int(15/5)  findIndex = 3

     if page/one_time_num > int(page/one_time_num):

         findIndex = int(page / one_time_num) + 1

     else:

         findIndex = int(page / one_time_num)

     #进行第一次查询，查询每次5页，每页4条的数据

     select_num = one_time_num * one_page_num #这里决一次定查询20条

     select_start = (findIndex - 1) * select_num  # 开始查询的索引

     select_down =  findIndex * select_num  # 结束查询的索引

     select_data = db_data[select_start: select_down]  #这里查询出了一次20条数据

     #下面对20条数据进行截取

     #findIndex 1

         # page = 1  1-(0*5)  gnPage = 1

         # page = 2  2-(0*5)  gnPage = 2

         # page = 3  3-(0*5)  gnPage = 3

         # page = 4  4-(0*5)  gnPage = 4

         # page = 5  5-(0*5)  gnPage = 5

     #findIndex 2

         # page = 6  6-(1*5)  gnPage = 1

         # page = 7  7-(1*5)  gnPage = 2

         # page = 8  8-(1*5)  gnPage = 3

         # page = 9  9-(1*5)  gnPage = 4

         # page = 10  10-(1*5)  gnPage = 5

     #findIndex 3

         # page = 11  11-(2*5)  gnPage = 1

         # page = 12  12-(2*5)  gnPage = 2

         # page = 13  13-(2*5)  gnPage = 3

         # page = 14  14-(2*5)  gnPage = 4

         # page = 15  15-(2*5)  gnPage = 5

     #设定 截取的索引位now_index

     now_index = page - (findIndex-1)*one_time_num

     #设定单页的截取起始

     page_start = (now_index - 1) * one_page_num

     page_end = now_index * one_page_num

     #开始截取

     page_data = select_data[page_start:page_end]

     #输出效果

     print("+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++")

     print("当前是第%s次查询"%findIndex)

     print("当前查询到的所有数据是 \n %s" % select_data)

     print("当前是 %s 页" % page)

     print("当前的数据是 \n %s " % page_data)

     print("+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++")

大家试一下吧。

基于Python的大数据的分页模型代码的更多相关文章

MySQL大数据量分页查询方法及其优化
MySQL大数据量分页查询方法及其优化 ---方法1: 直接使用数据库提供的SQL语句---语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N---适 ...
大数据实时处理-基于Spark的大数据实时处理及应用技术培训
随着互联网.移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代.大数据是指无法在一定时间内用常规软件工具对其内容进行抓取.管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的 ...
给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤（图文详解）
不多说,直接上干货! Impala和Hive的关系(详解) 扩展博客给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 参考 horton ...
【Python开发】Python 适合大数据量的处理吗？
Python 适合大数据量的处理吗? python 能处理数据库中百万行级的数据吗? 处理大规模数据时有那些常用的python库,他们有什么优缺点?适用范围如何? 需要澄清两点之后才可以比较全面的看这 ...
Python/Numpy大数据编程经验
Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. ...
Access大数据高效分页语句
Access大数据高效分页语句 oracle的分页查询可以利用rowid伪列. db2的分页查询可以利用row_number() over()聚合函数. mysql有limit. access仿佛先天 ...
高速基于echarts的大数据可视化
[Author]: kwu 高速基于echarts的大数据可视化,echarts纯粹的js实现的图表工具.高速开发的过程例如以下: 1.引入echarts的依赖js库 <script type= ...
软工之词频统计器及基于sketch在大数据下的词频统计设计
目录摘要算法关键红黑树稳定排序代码框架 .h文件: .cpp文件频率统计器的实现接口设计与实现接口设计核心功能词频统计器流程效果单元测试性能分析性能分析图问题发现解决方案 ...
黑马基础阶段测试题：创建一个存储字符串的集合list，向list中添加以下字符串：”C++”、”Java”、” Python”、”大数据与云计算”。遍历集合，将长度小于5的字符串从集合中删除，删除成功后，打印集合中的所有元素
package com.swift; import java.util.ArrayList; import java.util.List; import java.util.ListIterator; ...

随机推荐

ipfs camp course c demo exercise 1
目录 aim: my bugs 解决ipfs 的 cros 问题的方法 result final code for c1 aim: 首先咱们把 broswer 和自己的api 连接起来(要显示出来自 ...
Python学习第二十五课——Mysql （多表查询）
多表查询: 内连接查询: 首先:创建两个表一个为tableA,一个为tableB,并且插入数据(代码省略) 同时查询两个表的记录: select * from tableA,tableB; 根据tab ...
如何在PHP中防止SQL注入
使用PDO对象(对于任何数据库驱动都好用) addslashes用于单字节字符串的处理, 多字节字符用mysql_real_escape_string吧. 另外对于php手册中get_magic_qu ...
Python 爬取热词并进行分类数据分析-[热词分类+目录生成]
日期:2020.02.04 博客期:143 星期二 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[ ...
2019年mybatils面试高频题(java)
前前言 2019即将过去,伴随我们即将迎来的又是新的一年,过完春节,马上又要迎来新的金三银四面试季. 那么,作为程序猿的你,是否真的有所准备的呢,亦或是安于本职工作,继续做好手头上的事情. 当然,不论 ...
DVWA靶机--简单的文件上传漏洞
简单的文件上传漏洞(靶机安全级别:low) 事先准备好一句话木马,密码为pass 上传一句话木马,显示上传路径(一般网站是不会显示路径的,这里靶机为了方便你测试漏洞,直接显示出了路径: ../../h ...
Ollydbg使用问题汇总
1.可疑的断点描述:看上去您想在一些命令的中间位置或数据中设置断点. 如果真是这样的话, 这些断点将不会执行并可能严重影响调试的程序. 您真的希望在此设置断点吗? 选择否的话还是会出现这个问题 ...
c数据结构线性表的总结
1:连表的特点 1.链表是一种存储结构,用于存放线性表 2.连表的结点是根据需要调用动态分配内存函数进行分配的,因此链表可随需要伸长缩短在腰存储的数据个数未知的情况下节省内存. ...
Ubuntu18.04下Qt5.9.8连接mysql数据库失败的解决办法
问题: 连接mysql数据库时,出现如下提示: QSqlDatabase: QMYSQL driver not loaded QSqlDatabase: available drivers: QSQ ...
CMake构建Qt5的VS2015项目 (Hello Qt5)
Qt5的编译 Windows下载编译Qt5 Gui CMakeLists.txt 源码 cmake_minimum_required(VERSION 2.8.11) project(HelloQt5) ...

基于Python的大数据的分页模型代码

基于Python的大数据的分页模型代码的更多相关文章

随机推荐

热门专题