【statistics】查看2018.4.25日理想论坛某ID在一天中的活跃情况
用于统计的sum.py代码:
import re
import pymysql
# 入口函数
def main():
    dic={'00':0,'01':0,'02':0,'03':0,'04':0,'05':0,'06':0,'07':0,'08':0,'09':0,'10':0,'11':0,'12':0,'13':0,'14':0,'15':0,'16':0,'17':0,'18':0,'19':0,'20':0,'21':0,'22':0,'23':0}
    conn=pymysql.connect(host='127.0.0.1',user='root',passwd='12345678',db='test',charset='utf8')
    cs=conn.cursor()
    cs.execute("select * from topic0426 where author='天山剑阁' and tdate='2018-4-25'")
    results = cs.fetchall()
    for row in results:
        ttime=row[4]
        hour=ttime.split(':')[0]
        dic[hour]=dic[hour]+1
    conn.close()
    print(dic)
# 开始
main()
统计后的数据为:
{'00': 0, '01': 0, '02': 0, '03': 0, '04': 0, '05': 0, '06': 0, '07': 0, '08': 1, '09': 34, '10': 39, '11': 30, '12': 32, '13': 0, '14': 22, '15': 38, '16': 0, '17': 0, '18': 0, '19': 0, '20': 0, '21': 58, '22': 46, '23': 0}
展现出来则是:

另附上几个ID的统计图,通过这些活跃时间图可以观察出他们一个方面的用户行为:



【statistics】查看2018.4.25日理想论坛某ID在一天中的活跃情况的更多相关文章
- 【statistics】理想论坛2018-4-25日统计
		说明:利用理想论坛爬虫1.07版(http://www.cnblogs.com/xiandedanteng/p/8954115.html) 下载了前十页主贴及子贴,共得到359619条数据,以此数据为 ... 
- 【nodejs】理想论坛帖子下载爬虫1.08
		//====================================================== // 理想论坛帖子下载爬虫1.09 // 使用断点续传模式,因为网络传输会因各种原因中 ... 
- 【nodejs】理想论坛帖子下载爬虫1.07 使用request模块后稳定多了
		在1.06版本时,访问网页采用的时http.request,但调用次数多以后就问题来了. 寻找别的方案时看到了https://cnodejs.org/topic/53142ef833dbcb076d0 ... 
- 【python】理想论坛爬虫长贴版1.00
		理想论坛有些长贴,针对这些长贴做统计可以知道某ID什么时段更活跃. 爬虫代码为: #---------------------------------------------------------- ... 
- 【Nodejs】理想论坛帖子下载爬虫1.04
		一直想做一个能把理想论坛指定页范围的帖子都能完整下载下来的爬虫,但未能如愿. 主要的障碍在并发数的控制和长时间任务的突然退出,比如想下载前五页的帖子,分析后可得到大约15000个主贴或子贴,如果用回调 ... 
- 【pyhon】理想论坛爬虫1.05版,将读取和写DB分离成两个文件
		下午再接再厉仿照Nodejs版的理想帖子爬虫把Python版的也改造了下,但美中不足的是完成任务的线程数量似乎停滞在100个左右,让人郁闷.原因还待查. 先把代码贴出来吧,也算个阶段性成果. 爬虫代码 ... 
- 【Nodejs】理想论坛帖子爬虫1.01
		用Nodejs把Python实现过的理想论坛爬虫又实现了一遍,但是怎么判断所有回调函数都结束没有好办法,目前的spiderCount==spiderFinished判断法在多页情况下还是会提前中止. ... 
- 【Python】理想论坛帖子读取爬虫1.04版
		1.01-1.03版本都有多线程争抢DB的问题,线程数一多问题就严重了. 这个版本把各线程要添加数据的SQL放到数组里,等最后一次性完成,这样就好些了.但乱码问题和未全部完成即退出现象还在,而且速度上 ... 
- 【python】理想论坛爬虫1.08
		#------------------------------------------------------------------------------------ # 理想论坛爬虫1.08, ... 
随机推荐
- POI2018
			[BZOJ5099][POI2018]Pionek(极角排序+two pointers) 几个不会严谨证明的结论: 1.将所有向量按极角排序,则答案集合一定是连续的一段. 当答案方向确定时,则一个向量 ... 
- 破解神器Hashcat使用简介
			0x00 背景 目前GPU的速度越来越快,使用GPU超强的运算速度进行暴力密码破解也大大提高了成功率,曾经看到老外用26块显卡组成的分布式破解神器让我羡慕不已.要说目前最好的GPU破解HASH的软件, ... 
- spring boot2集成ES详解
			一:运行环境 JDK:1.8 ES:5.6.4 二:学习内容 如何构建spring-data-elasticsearch环境? 如何实现常用的增删改查? 如何实现对象嵌套也就是1对多这种关系? 三:J ... 
- Codeforces Round #297 (Div. 2)A. Vitaliy and Pie 水题
			Codeforces Round #297 (Div. 2)A. Vitaliy and Pie Time Limit: 2 Sec Memory Limit: 256 MBSubmit: xxx ... 
- .net mvc控制器传递方法到视图
			很多人都是在视图里面定义方法,然后再使用.我个人也是这么干的.但是为了验证是否可以将方法从控制器传递到视图,所以做了个测试.结果真的可以.原理是利用了委托(delegate),因为委托本身就是一种类型 ... 
- ActiveMQ Cluster (ActiveMQ 集群) 配置
			构建高可用的ActiveMQ系统在生产环境中是非常重要的,对于这个apache的消息中间件实现高可用非常简单,只要在Apache ActiveMQ单点基本配置基础上做一次配置变更(如果在一台设备上部署 ... 
- Node.js学习笔记(1) - Node.js简介
			近期在看一些Node.js的知识,看完后觉得,一些前面的东西忘记了,于是整理一下,方便自己查阅,也希望对学习Node.js的朋友有些帮助: 当然以下只是我个人的观点和理解,不喜勿喷,也望大神指教. 一 ... 
- PostgreSQL控制台以竖行显示
			\x select * from user; 这个和MySQL的有点区别,在查询之前使用\x进行显示的开启 注意:只需要用一次即可,以后的查询都是以竖行进行显示. 
- Jenkins搭建.NET自动编译测试与发布环境
			本文地址: http://blog.csdn.net/wangjia184/article/details/18365553 操作系统Windows, 确保需要的.NET Framework已经安装 ... 
- MVC到底使用哪种方式传递Model,在ViewData、ViewBag、PartialView、TempData、ViewModel、Tuple之间取舍
			在"MVC控制器传递多个Model到视图,使用ViewData, ViewBag, 部分视图, TempData, ViewModel, Tuple"中,体验了使用不同的方式传递多 ... 
