《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析
献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解
数据分析基础概念:
集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。
总体(population)是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。简单地说,总体也就是我们所研究的性质相同个体的总和,用符号N表示。
样本(sample),是指从总体中抽出的一部分个体。样本中所包含个体数目称样本容量或含量,用符号n表示。
标准差与方差的区别:从公式上可以很明显看出,方差是标准差的平方,其余一模一样。
那它们二者的区别就体现在,标准差是以最初的单位存在,而方差是以平方单位存在。
建立准备分析环境:
蜀汉五虎上将,是指罗贯中的长篇小说《三国演义》中,蜀汉昭烈帝刘备麾下的五员猛将,分别是:关羽、张飞、赵云、马超、黄忠。原文描写为“五虎大将”,后人惯称“五虎上将”。
SELECT *
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )

关羽、张飞、赵云、马超、黄忠武力值为:97,98,96,97,93
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )

魏五子良将
五子良将是指三国时期,曹魏势力的五位将军,即前将军张辽、右将军乐进、左将军于禁、征西车骑将军张郃以及右将军徐晃。
陈寿撰写魏书卷十七时,将此五人合传,叙述诸将生平事迹后评曰:“太祖建兹武功,而时之良将,五子为先”,因此现代人将其称之为“五子良将”或“魏五子”。
SELECT *
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )

张辽、乐进、于禁、张郃、徐晃 武力值为:92,84,78,89,90
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )

分析结论:
|
蜀汉五虎上将 |
魏五子良将 |
|
|
1均值 |
96.2 |
86.6 |
|
2中位数 |
97 |
89 |
|
3众数 |
97 |
- |
|
4最大 |
98 |
92 |
|
5最小 |
93 |
78 |
|
6极差 |
5 |
14 |
|
7总体方差 |
2.96 |
25.44 |
|
8总体标准差 |
1.72 |
5.04 |
|
9样本方差 |
3.7 |
31.80 |
|
10样本标准差 |
1.92 |
5.64 |
|
11 CV(sample) |
1.9958% CV(sample)= (1.92/96.2)*100%=1.9958% |
6.5127% CV(sample)= (5.64/86.6)*100%=6.5127% |
附录:蜀汉五虎上将、魏五子良将配图
《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析的更多相关文章
- 《BI那点儿事—数据的艺术》目录索引
原创·<BI那点儿事—数据的艺术>教程免费发布 各位园友,大家好,我是Bobby,在学习BI和开发的项目的过程中有一些感悟和想法,整理和编写了一些学习资料,本来只是内部学习使用,但为了方便 ...
- 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
什么是聚类分析? 聚类分析属于探索性的数据分析方法.通常,我们利用聚类分析将看似无序的对象进行分组.归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在三国数据 ...
- 《BI那点儿事》双变量的相关分析——相关系数
例如,“三国人物是否智力越高,政治就越高”,或是“是否武力越高,统率也越高:准备数据分析环境: SELECT * FROM FactSanguo11 WHERE 姓名 IN ( N'荀彧', N'荀攸 ...
- R语言数据分析系列六
R语言数据分析系列六 -- by comaple.zhang 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候怎样下手分析,数据分析的第一步.探索性数据分析. 统计量,即统计学里面关注的数据集 ...
- 传统BI还是自助式BI---BI与数据分析 ZT
自助式BI或者自助式数据分析是最近几年兴起的一个概念.根据Gartner发布的信息,Self Service Business Intelligence(SSBI)被定义为“终端用户在被批准和支持的平 ...
- Quick BI助力云上大数据分析---深圳云栖大会
在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析.大会现场的精彩分享也赢得观众们的一直认可和热烈的反响. 大数据分析之路的挑 ...
- R语言数据分析系列之四
R语言数据分析系列之四 -- by comaple.zhang 说到统计分析我们就离不开随机变量,所谓随机变量就是数学家们为了更好的拟合现实世界的数据而建立的数学模型.有了她我们甚至能够来预測一个站点 ...
- R语言数据分析系列之五
R语言数据分析系列之五 -- by comaple.zhang 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi ...
- 数据分析系列篇:玩转excel
数据分析系列篇:玩转excel 不知道现在怎么也变得这么鸡婆,连excel都要准备写一篇.没办法,还有很多不是做数据的小伙伴们不会excel啊,抱着不抛弃.不放弃的态度,就讲下excel如何玩转.其实 ...
随机推荐
- ThinkPHP 3.2.3 简单后台模块开发(二)RBAC
RBAC(Role-Based Access Controll)基于角色的访问控制 在 ThinkPHP3.2.3 中 RBAC 类位于 /ThinkPHP/Library/Org/Util/Rbac ...
- 获取唯一UUID/UDID方案
概述 如何保证获取到的UUID能够唯一标识每一台设备呢?我们知道通过UIDevice可以获取到UUIDString,但是如果App被删除了然后重新安装,就会得到不同的UUIDString,这并不是我们 ...
- 使用swfupload上传超过30M文件,使用FLASH上传组件
原文:使用swfupload上传超过30M文件,使用FLASH上传组件 前一段时间会员的上传组件改用FLASH的swfupload来上传,既能很友好的显示上传进度,又能完全满足大文件的上传. 后来服务 ...
- tomcat的maxThreads、acceptCount(最大线程数、最大排队数)
转载:http://blog.sina.com.cn/s/blog_605f5b4f01012ljj.html tomcat 的Connector配置如下 <Connector port=&qu ...
- LeetCode Strobogrammatic Number
原题链接在这里:https://leetcode.com/problems/strobogrammatic-number/ 题目: A strobogrammatic number is a numb ...
- video和audio
1.video 使用: <video width="320" height="240" src="http://www.jb51.net/mov ...
- MyBatis操作指南-搭建项目基础环境(基于XML)含log4j配置
- Java tomcat启动失败(Servlet3.0 Web Project):A child container failed during start
Tomcat启动失败,失败全部信息: 五月 , :: 下午 org.apache.tomcat.util.digester.SetPropertiesRule begin 警告: [SetProper ...
- VMware下安装虚拟机Ubuntu14.04 Server设置桥接方式
我本地的采用的上网方式的拨号上网,IP段是一公网下的通过路由设置的局域网,网段182.18.1.* 本地连接包含以下: 其中无线上网卡的.WMware桥接是自定义的局域网IP段:192.168.253 ...
- Java语言的特点
一. 面向对象:其实是现实世界模型的自然延伸.现实世界中任何实体都可以看作是对象.对象之间通过消息相互作用.另外,现实世界中任何实体都可归属于某类事物,任何对象都是某一类事物的实例.如果说传统的过程式 ...