CSDN泄漏数据完整分析

2011-12-22 08:59:26 53391 次阅读 0 条评论

感谢mayee的投递

昨天CSDN的用户数据库被人在网上公布。我下载分析了下里面的数据,得出了一些很有意思的现象。泄漏出来的数据只有三列:用户名、密码和邮箱。先来看看密码:

1.最常用的前50个密码

数量           密码

235037    123456789 

212761    12345678 

76349    11111111 

46054    dearbook 

34953    00000000 

20010    123123123 

17794    1234567890 

15033    88888888 

6995    111111111 

5966    147258369 

5890    aaaaaaaa 

5555    987654321 

5145    1111111111 

5026    66666666 

4686    a123456789 

4096    11223344 

3968    1qaz2wsx 

3650    password 

3649    xiazhili 

3610    789456123 

3505    qwertyuiop 

3491    qqqqqqqq 

3297    iloveyou 

3287    qq123456 

3282    87654321 

3175    000000000 

3100    asdfghjkl 

3063    31415926 

2985    12344321 

2943    1q2w3e4r 

2886    0000000000 

2770    QAZWSXEDC 

2752    123456abc 

2613    abcd1234 

2578    0123456789 

2573    123654789 

2540    12121212 

2437    asdasdasd 

2380    12341234 

2348    110110110 

2338    abc123456 

2298    aa123456 

2245    a12345678 

2243    22222222 

2219    a1234567 

2218    1234qwer 

2178    123456 

2166    123321123 

2165    qwertyui 

2113    123456123

看看里面有没有你常用的?

2.密码类型

我按 全部是数字;全部是字母;字母和数字;含特殊符号 为密码归了下类:

纯数字密码:2894567  (1)

纯字母密码:795778    (2)

字母和数字:2506714  (3)

含特殊符号:231572    (4)

另外还有一条数据密码是空

密码越复杂就越安全,但是采用字母数字加特殊符号高强度密码的只有231572,约占总共6428632个用户的 三十分之一

3.密码长度

数量         长度

2337895    8 

1550730    9 

929948    10 

627736    11 

368567    12 

167302    13 

154473    14 

84292    6 

74882    15 

49085    16 

33951    5 

18952    7 

7448    4 

6981    17 

5852    18 

5014    20 

2278    19 

1350    2 

1336    3 

559    1 

1    0

程序员的安全意识还是比较强的,密码普遍长度在8-14位。但是奈何不了明文存储,也奈何不了数据库泄漏哇

4.有多少程序员用手机号做密码

大约有189307个密码是以手机号形式存在的,按照号码前三位分类:

号码前三位 数量     

139    21171 

138    20996 

135    20248 

136    18444 

137    15876 

159    14347 

158    12455 

134    11076 

130    11004 

131    9441 

150    8074 

151    6737 

133    6068 

132    5880 

152    3356 

189    1102 

155    1082 

187    544 

153    528 

156    422 

186    238 

147    77 

157    45 

188    43 

145    24 

180    18 

185    9 

1349    2

看来程序员们还是最钟爱中国移动啊

5.有多少程序员用纪念日做密码

大约有437296个密码是以日期形式存在的,按数量排序如下

时间     数量

1987    43307 

1986    38670 

1988    37917 

1985    33117 

1984    32219 

1989    30284 

1983    28630 

1982    28432 

1981    18052 

1990    14514 

1980    12691 

1979    10528 

1978    9251 

1991    6391 

1977    6343 

1976    5186 

1975    4083 

2008    3923 

1974    3523 

1992    3260 

2006    3158 

2005    2978 

2004    2909 

2002    2815 

1973    2815 

2009    2691 

2003    2539 

1972    2504 

1993    2373 

2007    2290

如果认为密码就是该用户的生日,那么可以看出一些有意思的事情:80后是程序员的主力,85后已经崛起。

以200X为年份的,有可能是有了宝宝的程序员,以宝宝的生日为密码。

6.程序员们都用什么邮箱

下面是排名前30的邮箱提供商:

邮箱后缀    数量

qq.com    1976001 

163.com    1766935 

126.com    807818 

sina.com    351750 

yahoo.com.cn    205486 

hotmail.com    202965 

gmail.com    186809 

sohu.com    104756 

yahoo.cn    87040 

tom.com    72353 

yeah.net    53312 

21cn.com    50795 

vip.qq.com    35115 

139.com    29201 

263.net    24830 

sina.com.cn    19169 

live.cn    18918 

sina.cn    18599 

yahoo.com    18454 

foxmail.com    16430 

163.net    15279 

msn.com    14217 

eyou.com    13387 

yahoo.com.tw    10809 

huiseo.cn    8492 

csoftmail.cn    7121 

citiz.net    6617 

vip.sina.com    5379 

189.cn    5004 

etang.com    4261

网易邮箱 依旧是国内邮箱的老大,QQ正在快马追上。

CSDN泄漏数据完整分析的更多相关文章

  1. Springboot学习05-自定义错误页面完整分析

    Springboot学习06-自定义错误页面完整分析 前言 接着上一篇博客,继续分析Springboot错误页面问题 正文 1-自定义浏览器错误页面(只要将自己的错误页面放在指定的路径下即可) 1-1 ...

  2. 学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)

    前言 前面两篇文章介绍了 python 中两大模块 pandas 和 numpy 的一些基本使用方法,然而,仅仅会处理数据还是不够的,我们需要学会怎么分析,毫无疑问,利用图表对数据进行分析是最容易的, ...

  3. 基于Python项目的Redis缓存消耗内存数据简单分析(附详细操作步骤)

    目录 1 准备工作 2 具体实施   1 准备工作 什么是Redis? Redis:一个高性能的key-value数据库.支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使 ...

  4. KDD Cup 99网络入侵检测数据的分析

    看论文 该数据集是从一个模拟的美国空军局域网上采集来的 9 个星期的网络连接数据, 分成具有标识的训练数据和未加标识的测试数据.测试数据和训练数据有着不同的概率分布, 测试数据包含了一些未出现在训练数 ...

  5. SEM竞价数据基本分析方法

    今天我们从账户数据表现来看一看怎样通过数据分析,判断账户出现的问题及解决思路.也欢迎大家提出意见,共同讨论进步. 首先我们从关键词报告来分析数据: 以上图数据为例.(设定该行业CPC均价为8) 先说下 ...

  6. 在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析

    在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析 低成本的Blob存储是一个强大的.通用的Hadoop兼容Azure存储解决方式无缝集成HDInsight.通过Hadoop分布式 ...

  7. Xshell高级后门完整分析报告

    Xshell高级后门完整分析报告 from:https://security.tencent.com/index.php/blog/msg/120 1. 前言 近日,Xshell官方发布公告称其软件中 ...

  8. mapReduce 大数据离线分析

    数据分析一般分为两种,一种是在线一种是离线 流程: 一般都是对于日志文件的采集和分析 场景实例(某个电商网站产生的用户访问日志(access.log)进行离线处理与分析的过程) 1.需求: 基于Map ...

  9. 气象netCDF数据可视化分析

    气象netCDF数据可视化分析 2019-09-19 15:34:22 自走棋 阅读数 162更多 分类专栏: web前端   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载 ...

随机推荐

  1. 页面开发辅助类—HtmlHelper初步了解

    1.1 有失必有得 在ASP.Net MVC中微软并没有提供类似服务器端控件那种开发方式,毕竟微软的MVC就是传统的请求处理响应的回归.所以抛弃之前的那种事件响应的模型,抛弃服务器端控件也理所当然. ...

  2. Spring Boot 系列教程5-热部署-devtools模块

    devtools模块 devtools模块,是为开发者服务的一个模块.主要的功能就是代码修改后一般在5秒之内就会自动重新加载至服务器,相当于restart成功. 原理 简单原理 在发现代码有更改之后, ...

  3. 用PHP实现验证码功能

    目前,不少网站为了防止用户利用机器人自动注册.登录.灌水,都采用了 验证码技术.所谓验证码,就是将一串随机产生的数字或符号,生成一幅图片, 图片里加上一些干扰象素(防止OCR),由用户肉眼识别其中的验 ...

  4. Swift 学习笔记 (三) 之循环引用浅析

    原创:转载请注明出处 110.自动引用计数实践 下面的例子展示了自动引用计数的工作机制.例子以一个简单的Person类开始,并定义了一个叫name的常量属性: class Person {     l ...

  5. selenium和pythond的区别

    selenium和pythond的区别 天宇6169 | 浏览 137 次 2016-03-18 10:25 2016-03-18 12:24 最佳答案   selenium ide是用来录制的!大概 ...

  6. css 8.1

    1. border-collapse 属性设置是否将表格边框折叠为单一边框: table { border-collapse:collapse;  } 如果没有规定 !DOCTYPE,border-c ...

  7. Cloudsim 3.0在myclipse下的安装过程

    (1)下载cloudsim 3.0: http://code.google.com/p/cloudsim/downloads/list (2)下载flanaga.jar包  下载地址:http://w ...

  8. java thread park

    http://agapple.iteye.com/blog/970055 apidoc中说,park/unpark用来阻塞/激活线程,但是没有弃用方法suspend/resume的缺点,suspend ...

  9. source.list

    deb http://www.anheng.com.cn/debian/ squeeze maindeb-src http://www.anheng.com.cn/debian/ squeeze ma ...

  10. zf-关于注册码全部错误的解决方法

    之所以错误,是因为这里的用户名称是石首市政务服务中心. 在数据库里把这个字段改成 上海卓繁 就可以了 一般都是在 SYS_INFO 这张表里面改