第十九篇：Mysql两次Group by和ip转数字作比较的一次优化

业务场景：两张表，ipconfig_group表存了单位和 ip 起始段信息

visit_info表存储了访问次数，失败次数，访问流量，用户ip等信息

两张表的关系为：
一个部门下有若干ip段，对应的下面表的visitorip，每个visitorip有访问次数，失败次数，流量
现在，要按部门统计各部门的访问次数，失败次数，流量
通常的做法：
第一步：统计visit_info 表各个ip的次数

第二步：统计这些ip对应哪个部门，相同部门的对应字段叠加

常规方法：如果先搞定第一步，然后程序处理第二步，那么就需要用java模拟数据库查询的Group by
方法如下：

这里是只统计了流量，因为是已经做好的一个需求的逻辑，用java程序处理比较好理解
现在要统计3个字段累加，那么就只能定义一个Map<String,List<Integer>>,先遍历第一步返回的结果list
String是部门作为键，List<Integer>是后3个字段，放在一个List<Map<String,List<Integer>>>中
也可以用Map<String,Integer>存，放在List<Map<String,Map<String,Integer>>>，然后遍历最外层的list

像上图加红字标注的地方，那是一个简单的Integer相加，这里因为有3个要累加，
所以要写一个实现相同键（部门）对应的值（List<Integer>或Map<String,Integer>）累加的方法，怎么叠加很简单就不说了

可以想见，写起来非常麻烦，这就是java代替数据库Group by的方法逻辑吧

优化如下：首先肯定需要组合查询，第一步还是查一张表统计ip：
结果如下

第二步：组合查询，查询ip在符合的ip段内的部门统计结果
这里先要用到一个函数：inet_aton(ip),这个函数可以将任意一个标准的ip值：XXX.XXX.XXX.XXX转换成整数int型（最多10位）

好了所有的路铺平了，只差复合sql查出来就行了：

所有的逻辑，在数据库层面做完，程序再也不用那么麻烦，代码简化一大截
看，现在就一句代码了^^^^^^^^

性能的问题，暂时没考虑，因为截图测试的数据量很少，
但是如果是程序自己实现Group by，只是分步骤，数据库查询sql简单了，但是次数就非常多了，总的时间并不见得会短

这里有几个关键：
1、Group by用java程序实现，虽然是笨了点，但是也为以后做统计给了一种思路
2、ip段作比较用了mysql的inet_aton函数，事实上一开始我没想到有这个函数，实在是程序实现统计的逻辑太烦想图简单才去查阅
这也给了我们一个思路，上面截图最大的ip也才是10位的整型。mysql还有一个inet_ntoa函数用来将数字转为IP值

数据库优化原则：字段类型定义使用最合适（最小），最简单的数据类型
那么我们存进去的时候就可以考虑存为整型，取出来的时候用inet_ntoa()转为ip
附：a.b.c.d 的ip number是：
a * 2的11次方 + b * 2的10次方 + c * 2的8次方 + d * 2的0次方

第十九篇：Mysql两次Group by和ip转数字作比较的一次优化的更多相关文章

Python之路【第十九篇】：爬虫
Python之路[第十九篇]:爬虫网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用 ...
Egret入门学习日记 --- 第十九篇（书中 8.8~8.10 节内容）
第十九篇(书中 8.8~8.10 节内容) 开始 8.8节. 重点: 1.类型推断. 2.类型强制转换,使其拥有代码提示功能. 3.除了TS自带的类型判断,Egret官方也提供了类型判断的方法. 操 ...
Android UI开发第三十九篇——Tab界面实现汇总及比较
Tab布局是iOS的经典布局,Android应用中也有大量应用,前面也写过Android中TAb的实现,<Android UI开发第十八篇——ActivityGroup实现tab功能>.这 ...
Python开发【第十九篇】：Python操作MySQL
本篇对于Python操作MySQL主要使用两种方式: 原生模块 pymsql ORM框架 SQLAchemy pymsql pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb ...
【Python之路】第十九篇--Python操作MySQL
本篇对于Python操作MySQL主要使用两种方式: 原生模块 pymsql ORM框架 SQLAchemy pymsql pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb ...
十九、MySQL GROUP BY 语句
MySQL GROUP BY 语句 GROUP BY 语句根据一个或多个列对结果集进行分组. 在分组的列上我们可以使用 COUNT, SUM, AVG,等函数. GROUP BY 语法 SELECT ...
【Python之路】第十八篇--MySQL（一）
一.概述 1.什么是数据库 ? 答:数据的仓库. 2.什么是 MySQL.Oracle.SQLite.Access.MS SQL Server等 ? 答:他们均是一个软件,都有两个主要的功能: a. ...
第十九篇 -- QTableWidget的使用
QTableWidget的一些常用方法下面两个类可以根据自己的情况自定义. 单元格类型的类: class CellType(Enum): ctKey = 1000 ctPath = 1001 ctI ...
java web学习总结(二十九) -------------------JavaBean的两种开发模式
SUN公司推出JSP技术后,同时也推荐了两种web应用程序的开发模式,一种是JSP+JavaBean模式,一种是Servlet+JSP+JavaBean模式. 一.JSP+JavaBean开发模式 1 ...

随机推荐

Promise 解决同步请求问题
在写小程序和vue项目中,由于 api 不提供同步请求,因此,可以通过 Promise 来实现同步请求操作在这里对于 Promise 不太了解的小伙伴可以查找 Promise 的api 文 ...
前置控制器一DispatcherServlet
org.springframework.web.servlet.DispatcherServlet 前言 DispatcherServlet是SpringMVC的核心控制器,就像是SpringMVC的 ...
JavaWeb学习篇之----Servlet
今天来继续学习JavaWeb的相关知识,之前都是都介绍一些基本知识,从今天开始我们来说一下如何在服务器编写程序,这里就需要来介绍一下Servlet的相关知识了.Servlet就是一个能够运行在服务器端 ...
NX二次开发-NXString转换为char*方法
NX9+VS2012 #include <uf.h> #include <uf_drf.h> #include <NXOpen/Annotations_Note.hxx& ...
NX二次开发-常用lib库文件
在项目属性->配置属性->链接器->输入->附加依赖项: libufun.lib UFUNC API 函数库 libugopenint.lib UFUNC 对话框 API 函数 ...
NX二次开发-设置功能区工具栏的可见性UF_UI_set_ribbon_vis
NX9+VS2012 1.打开D:\Program Files\Siemens\NX 9.0\UGII\menus\ug_main.men 找到装配和PMI,在中间加上一段 TOGGLE_BUTTON ...
NX二次开发-NXOPEN导出STEP Step214Creator *step214Creator1;
没有什么可以看的,NXOPEN直接录制一下导出STEP就可以了.录制出来自己挑需要的代码拿过来改一下. NX9+VS2012 #include <NXOpen/Part.hxx> #inc ...
nginx、php-fpm安装mongodb及驱动扩展
1.安装mongodb linux下安装mongodb很简单,执行如下命令完成安装 wget http://downloads.mongodb.org/linux/mongodb-linux-i686 ...
Linux下同一目录内文件和目录为什么不能同名？
问题描述: 如果事先有叫‘A’的文件夹存在,则不允许建立叫‘A’的文件: 同理若先有叫‘b’的文件存在,一样不允许建立叫‘b’的文件夹. 原因很简单,因为Linux下一切都是文件,一个目录归根到底还是 ...
spark-sql性能优化之——多线程实现多Job并发执行
直接上代码 val spark = SparkSession.builder() .appName("name") .master("local[2]") .g ...

第十九篇：Mysql两次Group by和ip转数字作比较的一次优化

第十九篇：Mysql两次Group by和ip转数字作比较的一次优化的更多相关文章

随机推荐

热门专题