#######################################

已更新续集,戳这里

  ########################################  

  是这样的,有位学姐呢初学python ,问我怎么处理QQ聊天记录,当时就说了用正则,也没去写,现在闲着(被ajax虐哭。。。先放一放)就来简单写一下。

目标,统计近一个月来,QQ群在一天24个时间段的发言量。

    Step1:获取QQ聊天记录

    这个简单无脑了。。。直接导出消息记录即可。详情参考这里。导出时,记得要保存为txt格式,并和python文件放到同一文件夹下(只是为了方便)。

    Step2:开始撸码

    环境:python3+pycharm+xlsxwriter

    上代码:

import re
import xlsxwriter # 获取24个时间段----->time_list
# 用于之后时间的分段
time_list = []
for i in range(0,24):
# 这里的判断用于将类似的‘8’ 转化为 ‘08’ 便于和导出数据匹配
if i < 10:
i = '0'+str(i)
else:
i = str(i)
time_list.append(i)
# 创建EXCEL表格并设置参数
workbook = xlsxwriter.Workbook('这里是表格名称.xlsx')
worksheet = workbook.add_worksheet()
worksheet.set_column('A:A', 5)
worksheet.set_column('B:B', 10) # 定义一个函数,对每一个时间段进行计数
# times是正则匹配到的 “小时” 数据,在一个列表里面
def everytime(i):
num = 0
for time in times:
if time == i:
num += 1
print(i, '--->', num)
# 计数完毕,写入数据,write参数为:行,列,数据
worksheet.write(int(i), 0, str(i)+"点")
worksheet.write(int(i), 1, num) # 打开文件,开始匹配“小时”数据,并计数保存
# 这里记得要转换编码为utf-8
with open("这里是txt文件名", encoding='utf-8') as f:
data = f.read()
# 例如20:50:52,要匹配其中的20
pa = re.compile(r"(\d\d):\d\d:\d\d")
times = re.findall(pa, data)
for i in time_list:
everytime(i)
# 记得关闭工作薄
workbook.close()
print("处理完毕,快去看看文件夹下面新建的.xlsx文件吧")

  

  代码比较丑。。。欢迎指正。

  输出如下:

  之后那,就要可视化了,嗯,Python的matplotlib对我来说太高大上,那就用EXCEL来吧。。。

  Step3:EXCEL可视化

  可视化,嗯,其实就是简单做个折线图,23333.为了折线图方便观察,可以适当调整一下时间的前后顺序。

  我按照这个顺序来的:(将凌晨数据量小的放在两边)

    最后:

    这是加的编程的群,我来猜测一下这个图吧,不负责的猜测那种。。。。

    7点爬起来去上班,越到临近中午下班越激动,中午饭后来个午睡,开始一下午昏昏欲睡的撸码工作,终于熬到下班,吃完晚饭开始愉快的撸码。。。没错还是撸码。。

勤奋的程序员们,学习到23点,渐渐有点虚,嗯,就去睡觉啦,毕竟明天还要上班,还要撸码。。。(以上内容,开个玩笑而已2333333)

用python做些有意思的事——分析QQ聊天记录的更多相关文章

  1. 用python做些有意思的事——分析QQ聊天记录——私人订制

    之前,写了这篇文章,用python提取全部群成员的发言时间,并简单做了下分析.先补充一下,针对特定单个群成员(这里以  小小白   为例)消息记录的获取. 代码比较简单,主要是正则表达式的书写.(附: ...

  2. 使用训练好的modle,做些有用的事(各层数据可视化)

    ---恢复内容开始--- 1. 加载必要的库: 2. 设置当前目录,判断模型是否训练好: 3. 利用提前训练好的模型,设置测试网络: 4. 加载测试图片,并显示: 5. 编写一个函数,将二进制的均值转 ...

  3. 安装 Kali Linux 后需要做的 20 件事

    安装 Kali Linux 后需要做的 20 件事 本文含有我觉得有用的每一件事情.本文分为三大部分: 专门针对Kali用户 Kali Linux是来自Debian的一个特殊版本,Kali Linux ...

  4. 拿Proxy可以做哪些有意思的事儿

    Proxy是什么 首先,我们要清楚,Proxy是什么意思,这个单词翻译过来,就是 代理.可以理解为,有一个很火的明星,开通了一个微博账号,这个账号非常活跃,回复粉丝.到处点赞之类的,但可能并不是真的由 ...

  5. spring扩展点之三:Spring 的监听事件 ApplicationListener 和 ApplicationEvent 用法,在spring启动后做些事情

    <spring扩展点之三:Spring 的监听事件 ApplicationListener 和 ApplicationEvent 用法,在spring启动后做些事情> <服务网关zu ...

  6. JavaScript的Proxy可以做哪些有意思的事儿

    摘要: 神奇而有趣的Proxy. 原文:拿Proxy可以做哪些有意思的事儿 作者:贾顺名 Fundebug经授权转载,版权归原作者所有. Proxy是什么 首先,我们要清楚,Proxy是什么意思,这个 ...

  7. 【转】用Python做股市量化策略投资数据分析

    金融量化分析介绍     本文摘要; 金融量化分析介绍 1.什么是金融量化分析 2.金融量化分析可以干什么 3.为什么将python运用于金融 4.常用库简介 1.什么是金融量化分析 从标题中我们可以 ...

  8. 曹工说Redis源码(7)-- redis server 的周期执行任务,到底要做些啥

    文章导航 Redis源码系列的初衷,是帮助我们更好地理解Redis,更懂Redis,而怎么才能懂,光看是不够的,建议跟着下面的这一篇,把环境搭建起来,后续可以自己阅读源码,或者跟着我这边一起阅读.由于 ...

  9. 我用Python做了一个咖啡馆数据分析

    在做案例前,我还想回答大家一个疑问,就是excel做数据分析可以实现Python一样的效果,那用Python的意义在哪呢? 经过这段时间学习理解,我的回答是: (https://jq.qq.com/? ...

随机推荐

  1. 《javascript高级程序设计》 第24章 最佳实践 Best Practices

    24.1 可维护性 Maintainability24.1.1 什么是可维护的代码 What Is Maintainable Code?24.1.2 代码约定 Code Conventions 24. ...

  2. Qt之资源系统

    简述 Qt 的资源系统用于存储应用程序的可执行二进制文件,它采用平台无关的机制.当你的程序总需要这样的一系列文件(图标.翻译文件等)并且不想冒丢失某些文件的风险时,这就显得十分有用. 资源系统基于 q ...

  3. 初学java之JFrame窗口模式

    package project; import javax.swing.*; import java.awt.*; public class test { public static void mai ...

  4. org.springframework.web.servlet.PageNotFound No mapping found for HTTP request with URI [/AssetRepair/assetRepairController/test.do] in DispatcherServlet with name 'assetrepair'

    web.xml文件配置: xxx-servlet.xml 我们可以发现DispatcherServlet会处理"jsp"后缀的请求;而模型视图后缀也是jsp的 如果这样配置会报以下 ...

  5. jQuery性能优化指南(转载)

    现在jquery应用的越来越多, 有些同学在享受爽快淋漓coding时就将性能问题忽略了, 比如我. jquery虽在诸多的js类库中性能表现还算优秀, 但毕竟不是在用原生的javascript开发, ...

  6. BZOJ1727 [Usaco2006 Open]The Milk Queue 挤奶队列

    贪心...我怎么不会QAQ[捂脸熊] 对于1.2两头牛,如果1号牛要排在2号牛前面才能时间更少,则 $$max(A_1 + B_1 + B_2, \ A_1 + A_2 + B_2) \le max( ...

  7. c#获取系统时间的方法(转)

      1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 ...

  8. 如何在 Linux 上用 SQL 语句来查询 Apache 日志

    Linux 有一个显著的特点,在正常情况下,你可以通过日志分析系统日志来了解你的系统中发生了什么,或正在发生什么.的确,系统日志是系统管理员在解决系统和应用问题时最需要的第一手资源.我们将在这篇文章中 ...

  9. MySQL存储过程之事务管理

    原文链接:http://hideto.iteye.com/blog/195275 MySQL存储过程之事务管理 ACID:Atomic.Consistent.Isolated.Durable 存储程序 ...

  10. Js笔试题之千分位格式化

    用js实现如下功能,将给定的数字转化成千分位的格式,如把“10000”转化成“10,000”,并考虑到性能方面的因素. 一.首先想到的办法,将数字转换为字符串(toString())再打散成数组(sp ...