CSDN泄漏数据完整分析
CSDN泄漏数据完整分析

感谢mayee的投递
昨天CSDN的用户数据库被人在网上公布。我下载分析了下里面的数据,得出了一些很有意思的现象。泄漏出来的数据只有三列:用户名、密码和邮箱。先来看看密码:
数量 密码
235037 123456789
212761 12345678
76349 11111111
46054 dearbook
34953 00000000
20010 123123123
17794 1234567890
15033 88888888
6995 111111111
5966 147258369
5890 aaaaaaaa
5555 987654321
5145 1111111111
5026 66666666
4686 a123456789
4096 11223344
3968 1qaz2wsx
3650 password
3649 xiazhili
3610 789456123
3505 qwertyuiop
3491 qqqqqqqq
3297 iloveyou
3287 qq123456
3282 87654321
3175 000000000
3100 asdfghjkl
3063 31415926
2985 12344321
2943 1q2w3e4r
2886 0000000000
2770 QAZWSXEDC
2752 123456abc
2613 abcd1234
2578 0123456789
2573 123654789
2540 12121212
2437 asdasdasd
2380 12341234
2348 110110110
2338 abc123456
2298 aa123456
2245 a12345678
2243 22222222
2219 a1234567
2218 1234qwer
2178 123456
2166 123321123
2165 qwertyui
2113 123456123
看看里面有没有你常用的?
2.密码类型
我按 全部是数字;全部是字母;字母和数字;含特殊符号 为密码归了下类:
纯数字密码:2894567 (1)
纯字母密码:795778 (2)
字母和数字:2506714 (3)
含特殊符号:231572 (4)
另外还有一条数据密码是空
密码越复杂就越安全,但是采用字母数字加特殊符号高强度密码的只有231572,约占总共6428632个用户的 三十分之一
3.密码长度
数量 长度
2337895 8
1550730 9
929948 10
627736 11
368567 12
167302 13
154473 14
84292 6
74882 15
49085 16
33951 5
18952 7
7448 4
6981 17
5852 18
5014 20
2278 19
1350 2
1336 3
559 1
1 0
程序员的安全意识还是比较强的,密码普遍长度在8-14位。但是奈何不了明文存储,也奈何不了数据库泄漏哇
4.有多少程序员用手机号做密码
大约有189307个密码是以手机号形式存在的,按照号码前三位分类:
号码前三位 数量
139 21171
138 20996
135 20248
136 18444
137 15876
159 14347
158 12455
134 11076
130 11004
131 9441
150 8074
151 6737
133 6068
132 5880
152 3356
189 1102
155 1082
187 544
153 528
156 422
186 238
147 77
157 45
188 43
145 24
180 18
185 9
1349 2
看来程序员们还是最钟爱中国移动啊
5.有多少程序员用纪念日做密码
大约有437296个密码是以日期形式存在的,按数量排序如下
时间 数量
1987 43307
1986 38670
1988 37917
1985 33117
1984 32219
1989 30284
1983 28630
1982 28432
1981 18052
1990 14514
1980 12691
1979 10528
1978 9251
1991 6391
1977 6343
1976 5186
1975 4083
2008 3923
1974 3523
1992 3260
2006 3158
2005 2978
2004 2909
2002 2815
1973 2815
2009 2691
2003 2539
1972 2504
1993 2373
2007 2290
如果认为密码就是该用户的生日,那么可以看出一些有意思的事情:80后是程序员的主力,85后已经崛起。
以200X为年份的,有可能是有了宝宝的程序员,以宝宝的生日为密码。
6.程序员们都用什么邮箱
下面是排名前30的邮箱提供商:
邮箱后缀 数量
qq.com 1976001
163.com 1766935
126.com 807818
sina.com 351750
yahoo.com.cn 205486
hotmail.com 202965
gmail.com 186809
sohu.com 104756
yahoo.cn 87040
tom.com 72353
yeah.net 53312
21cn.com 50795
vip.qq.com 35115
139.com 29201
263.net 24830
sina.com.cn 19169
live.cn 18918
sina.cn 18599
yahoo.com 18454
foxmail.com 16430
163.net 15279
msn.com 14217
eyou.com 13387
yahoo.com.tw 10809
huiseo.cn 8492
csoftmail.cn 7121
citiz.net 6617
vip.sina.com 5379
189.cn 5004
etang.com 4261
网易邮箱 依旧是国内邮箱的老大,QQ正在快马追上。
CSDN泄漏数据完整分析的更多相关文章
- Springboot学习05-自定义错误页面完整分析
Springboot学习06-自定义错误页面完整分析 前言 接着上一篇博客,继续分析Springboot错误页面问题 正文 1-自定义浏览器错误页面(只要将自己的错误页面放在指定的路径下即可) 1-1 ...
- 学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)
前言 前面两篇文章介绍了 python 中两大模块 pandas 和 numpy 的一些基本使用方法,然而,仅仅会处理数据还是不够的,我们需要学会怎么分析,毫无疑问,利用图表对数据进行分析是最容易的, ...
- 基于Python项目的Redis缓存消耗内存数据简单分析(附详细操作步骤)
目录 1 准备工作 2 具体实施 1 准备工作 什么是Redis? Redis:一个高性能的key-value数据库.支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使 ...
- KDD Cup 99网络入侵检测数据的分析
看论文 该数据集是从一个模拟的美国空军局域网上采集来的 9 个星期的网络连接数据, 分成具有标识的训练数据和未加标识的测试数据.测试数据和训练数据有着不同的概率分布, 测试数据包含了一些未出现在训练数 ...
- SEM竞价数据基本分析方法
今天我们从账户数据表现来看一看怎样通过数据分析,判断账户出现的问题及解决思路.也欢迎大家提出意见,共同讨论进步. 首先我们从关键词报告来分析数据: 以上图数据为例.(设定该行业CPC均价为8) 先说下 ...
- 在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析
在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析 低成本的Blob存储是一个强大的.通用的Hadoop兼容Azure存储解决方式无缝集成HDInsight.通过Hadoop分布式 ...
- Xshell高级后门完整分析报告
Xshell高级后门完整分析报告 from:https://security.tencent.com/index.php/blog/msg/120 1. 前言 近日,Xshell官方发布公告称其软件中 ...
- mapReduce 大数据离线分析
数据分析一般分为两种,一种是在线一种是离线 流程: 一般都是对于日志文件的采集和分析 场景实例(某个电商网站产生的用户访问日志(access.log)进行离线处理与分析的过程) 1.需求: 基于Map ...
- 气象netCDF数据可视化分析
气象netCDF数据可视化分析 2019-09-19 15:34:22 自走棋 阅读数 162更多 分类专栏: web前端 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载 ...
随机推荐
- 页面开发辅助类—HtmlHelper初步了解
1.1 有失必有得 在ASP.Net MVC中微软并没有提供类似服务器端控件那种开发方式,毕竟微软的MVC就是传统的请求处理响应的回归.所以抛弃之前的那种事件响应的模型,抛弃服务器端控件也理所当然. ...
- Spring Boot 系列教程5-热部署-devtools模块
devtools模块 devtools模块,是为开发者服务的一个模块.主要的功能就是代码修改后一般在5秒之内就会自动重新加载至服务器,相当于restart成功. 原理 简单原理 在发现代码有更改之后, ...
- 用PHP实现验证码功能
目前,不少网站为了防止用户利用机器人自动注册.登录.灌水,都采用了 验证码技术.所谓验证码,就是将一串随机产生的数字或符号,生成一幅图片, 图片里加上一些干扰象素(防止OCR),由用户肉眼识别其中的验 ...
- Swift 学习笔记 (三) 之循环引用浅析
原创:转载请注明出处 110.自动引用计数实践 下面的例子展示了自动引用计数的工作机制.例子以一个简单的Person类开始,并定义了一个叫name的常量属性: class Person { l ...
- selenium和pythond的区别
selenium和pythond的区别 天宇6169 | 浏览 137 次 2016-03-18 10:25 2016-03-18 12:24 最佳答案 selenium ide是用来录制的!大概 ...
- css 8.1
1. border-collapse 属性设置是否将表格边框折叠为单一边框: table { border-collapse:collapse; } 如果没有规定 !DOCTYPE,border-c ...
- Cloudsim 3.0在myclipse下的安装过程
(1)下载cloudsim 3.0: http://code.google.com/p/cloudsim/downloads/list (2)下载flanaga.jar包 下载地址:http://w ...
- java thread park
http://agapple.iteye.com/blog/970055 apidoc中说,park/unpark用来阻塞/激活线程,但是没有弃用方法suspend/resume的缺点,suspend ...
- source.list
deb http://www.anheng.com.cn/debian/ squeeze maindeb-src http://www.anheng.com.cn/debian/ squeeze ma ...
- zf-关于注册码全部错误的解决方法
之所以错误,是因为这里的用户名称是石首市政务服务中心. 在数据库里把这个字段改成 上海卓繁 就可以了 一般都是在 SYS_INFO 这张表里面改