CSDN泄漏数据完整分析
CSDN泄漏数据完整分析

感谢mayee的投递
昨天CSDN的用户数据库被人在网上公布。我下载分析了下里面的数据,得出了一些很有意思的现象。泄漏出来的数据只有三列:用户名、密码和邮箱。先来看看密码:
数量 密码
235037 123456789
212761 12345678
76349 11111111
46054 dearbook
34953 00000000
20010 123123123
17794 1234567890
15033 88888888
6995 111111111
5966 147258369
5890 aaaaaaaa
5555 987654321
5145 1111111111
5026 66666666
4686 a123456789
4096 11223344
3968 1qaz2wsx
3650 password
3649 xiazhili
3610 789456123
3505 qwertyuiop
3491 qqqqqqqq
3297 iloveyou
3287 qq123456
3282 87654321
3175 000000000
3100 asdfghjkl
3063 31415926
2985 12344321
2943 1q2w3e4r
2886 0000000000
2770 QAZWSXEDC
2752 123456abc
2613 abcd1234
2578 0123456789
2573 123654789
2540 12121212
2437 asdasdasd
2380 12341234
2348 110110110
2338 abc123456
2298 aa123456
2245 a12345678
2243 22222222
2219 a1234567
2218 1234qwer
2178 123456
2166 123321123
2165 qwertyui
2113 123456123
看看里面有没有你常用的?
2.密码类型
我按 全部是数字;全部是字母;字母和数字;含特殊符号 为密码归了下类:
纯数字密码:2894567 (1)
纯字母密码:795778 (2)
字母和数字:2506714 (3)
含特殊符号:231572 (4)
另外还有一条数据密码是空
密码越复杂就越安全,但是采用字母数字加特殊符号高强度密码的只有231572,约占总共6428632个用户的 三十分之一
3.密码长度
数量 长度
2337895 8
1550730 9
929948 10
627736 11
368567 12
167302 13
154473 14
84292 6
74882 15
49085 16
33951 5
18952 7
7448 4
6981 17
5852 18
5014 20
2278 19
1350 2
1336 3
559 1
1 0
程序员的安全意识还是比较强的,密码普遍长度在8-14位。但是奈何不了明文存储,也奈何不了数据库泄漏哇
4.有多少程序员用手机号做密码
大约有189307个密码是以手机号形式存在的,按照号码前三位分类:
号码前三位 数量
139 21171
138 20996
135 20248
136 18444
137 15876
159 14347
158 12455
134 11076
130 11004
131 9441
150 8074
151 6737
133 6068
132 5880
152 3356
189 1102
155 1082
187 544
153 528
156 422
186 238
147 77
157 45
188 43
145 24
180 18
185 9
1349 2
看来程序员们还是最钟爱中国移动啊
5.有多少程序员用纪念日做密码
大约有437296个密码是以日期形式存在的,按数量排序如下
时间 数量
1987 43307
1986 38670
1988 37917
1985 33117
1984 32219
1989 30284
1983 28630
1982 28432
1981 18052
1990 14514
1980 12691
1979 10528
1978 9251
1991 6391
1977 6343
1976 5186
1975 4083
2008 3923
1974 3523
1992 3260
2006 3158
2005 2978
2004 2909
2002 2815
1973 2815
2009 2691
2003 2539
1972 2504
1993 2373
2007 2290
如果认为密码就是该用户的生日,那么可以看出一些有意思的事情:80后是程序员的主力,85后已经崛起。
以200X为年份的,有可能是有了宝宝的程序员,以宝宝的生日为密码。
6.程序员们都用什么邮箱
下面是排名前30的邮箱提供商:
邮箱后缀 数量
qq.com 1976001
163.com 1766935
126.com 807818
sina.com 351750
yahoo.com.cn 205486
hotmail.com 202965
gmail.com 186809
sohu.com 104756
yahoo.cn 87040
tom.com 72353
yeah.net 53312
21cn.com 50795
vip.qq.com 35115
139.com 29201
263.net 24830
sina.com.cn 19169
live.cn 18918
sina.cn 18599
yahoo.com 18454
foxmail.com 16430
163.net 15279
msn.com 14217
eyou.com 13387
yahoo.com.tw 10809
huiseo.cn 8492
csoftmail.cn 7121
citiz.net 6617
vip.sina.com 5379
189.cn 5004
etang.com 4261
网易邮箱 依旧是国内邮箱的老大,QQ正在快马追上。
CSDN泄漏数据完整分析的更多相关文章
- Springboot学习05-自定义错误页面完整分析
Springboot学习06-自定义错误页面完整分析 前言 接着上一篇博客,继续分析Springboot错误页面问题 正文 1-自定义浏览器错误页面(只要将自己的错误页面放在指定的路径下即可) 1-1 ...
- 学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)
前言 前面两篇文章介绍了 python 中两大模块 pandas 和 numpy 的一些基本使用方法,然而,仅仅会处理数据还是不够的,我们需要学会怎么分析,毫无疑问,利用图表对数据进行分析是最容易的, ...
- 基于Python项目的Redis缓存消耗内存数据简单分析(附详细操作步骤)
目录 1 准备工作 2 具体实施 1 准备工作 什么是Redis? Redis:一个高性能的key-value数据库.支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使 ...
- KDD Cup 99网络入侵检测数据的分析
看论文 该数据集是从一个模拟的美国空军局域网上采集来的 9 个星期的网络连接数据, 分成具有标识的训练数据和未加标识的测试数据.测试数据和训练数据有着不同的概率分布, 测试数据包含了一些未出现在训练数 ...
- SEM竞价数据基本分析方法
今天我们从账户数据表现来看一看怎样通过数据分析,判断账户出现的问题及解决思路.也欢迎大家提出意见,共同讨论进步. 首先我们从关键词报告来分析数据: 以上图数据为例.(设定该行业CPC均价为8) 先说下 ...
- 在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析
在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析 低成本的Blob存储是一个强大的.通用的Hadoop兼容Azure存储解决方式无缝集成HDInsight.通过Hadoop分布式 ...
- Xshell高级后门完整分析报告
Xshell高级后门完整分析报告 from:https://security.tencent.com/index.php/blog/msg/120 1. 前言 近日,Xshell官方发布公告称其软件中 ...
- mapReduce 大数据离线分析
数据分析一般分为两种,一种是在线一种是离线 流程: 一般都是对于日志文件的采集和分析 场景实例(某个电商网站产生的用户访问日志(access.log)进行离线处理与分析的过程) 1.需求: 基于Map ...
- 气象netCDF数据可视化分析
气象netCDF数据可视化分析 2019-09-19 15:34:22 自走棋 阅读数 162更多 分类专栏: web前端 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载 ...
随机推荐
- 我为什么坚持DBA一定要懂开发
我为什么坚持DBA一定要懂开发时间 2016-03-23 15:34:08 张碧池的幸福生活原文 http://pottievil.com/我为什么坚持dba一定要懂开发/主题 DBA 数据库最近手头 ...
- Htttp协议
我 们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator,统一资源定位符).就像每家每户都有一个门牌地址一样, 每个网页也都有一个Internet地址.当你在浏览 ...
- python3 与 python2的 区别比较
http://sebug.net/paper/books/dive-into-python3/porting-code-to-python-3-with-2to3.html
- vps安装wordpress遇到的问题(lnmp)
1.要执行请求的操作,WordPress 需要访问您网页服务器的权限. 请输入您的 FTP 登录XXXX完美解决方法 因为在wordpress中新上传的插件的权限都是www用户的,而不是root或其他 ...
- RatingBar
题记:保持旺盛的求知欲.希望会一直这样. 说明:来了新控件了.就是经常用的打分的那种东东. 说明:1.看上图分别是系统自带的和自己做的.rating就是设置小星星的数目. 2.用系统自带的必须是Wra ...
- LoadRunner 技巧之协议分析(五)
在做性能测试的时候,协议分析是困扰初学者的难题,选择错误的协议会导致Virtual User Generator 录制不到脚本:或录制的脚本不完整,有些应用可能需要选择多个协议才能完整的记录 客户端与 ...
- FZU 1914 Funny Positive Sequence(线性算法)
这个当时我没有做出来,看了很多人包括学长的代码才懂,我感觉最好的方法还是下面那一种,标记以谁开头的是不行的,我感觉有点不好理解,如果不懂举组样例在纸上写一下就会比较清楚了 #include<io ...
- 关于jsp页面 title中文乱码问题的解决方法
我知道了 我jsp饮用了html 是我2个页面都写了Title 然后冲突了 就乱码了 分享给大家
- 2016大连网络赛 Sparse Graph
Sparse Graph Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others) P ...
- 会员登录HTML
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%><!DOCTYPE html PUBLIC "-//W ...