Coursera课程《数据科学家的工具箱》 约翰霍普金斯大学

Week3 Conceptual Issues

Types of Questions

Types of Data Science Questions

  • 描述性分析(Descriptive)

在没有额外的统计建模的基础上,这些描述通常没什么普遍性。

美国的人口普查就是一个描述性分析的例子。

  • 探索性分析(Exploratory)

在该分析类型中,我们试着去观察数据并发现之前未知的关系,因此这种分析有利于发现新的关联,同时也有助于确定今后的数据科学项目。

  • 推断分析(Inferential)

推断分析的目标是在少量观察的基础上,根据一小部分数据,将得到的信息进行归纳、外推到更大的群体。

例子:美国的空气污染控制对平均寿命的影响。

  • 预测分析(Predictive)

预测分析是利用某些对象收集到的数据,去预测下次观察很可能碰到的另一个对象的值。

有一点需要注意,即使通过x预测到了y,也不能说是x导致了y。

  • 因果分析(Causal)

这一分析类型就旨在了解,如果改变了一个变量的值会发生什么?这会对另一个变量的值造成怎样的改变?

实施因果分析的权威标准是,利用随机研究或随机对照试验来确认因果关系。

  • 机理分析(Mechanistic)

机理分析是要去理解变量的精确变化,和导致了其它变量精确变化的变量的过程。

机理分析最常见的应用范围,可能是在物理或工程学领域,利用一些比较简单的模型,就可以描述许多操作。

What is Data?

维基百科的定义

Data are values of qualitative or quantitative variables, belonging to a set of items.

定性变量是诸如原产国、性别或治疗方法之类的东西。它们不一定是有序的,也不一定是测量值。

定量变量是诸如身高、体重和血压等的数据。它们的测量值通常是连续的,在特定范围里的是有序的。

What About Big Data?

(基本没有干货……)

Experimental Design

安利一个数据共享网站figshare

Confounding

比如说假如在某项研究中,我们统计了鞋号和识字能力。然后我们试着去发现,鞋号和识字能力之间的相关性。

可能我们确实观察到了一些相关性,因为穿小号鞋的人可能会认识少一些的字。但是我们可能忽略了一点,年龄才是导致这个相关性的真正原因。因为婴儿的鞋号非常小,识字能力也很低。再长大一点,需要更大号的鞋子,认识的字也更多,所以年龄才是真正的导致鞋号和识字能力之间相关性的混杂因素。

所以如果我们只统计鞋号和识字能力,然后去发现两个变量之间的相关性,我们可能就误入歧途了。这种情况称作混杂(Confounding)。它关注于研究可能导致相关性的其它变量。

【DataScience学习笔记】Coursera课程《数据科学家的工具箱》 约翰霍普金斯大学——Week3 Conceptual Issues课堂笔记的更多相关文章

  1. 【Python学习笔记】Coursera课程《Using Python to Access Web Data》 密歇根大学 Charles Severance——Week6 JSON and the REST Architecture课堂笔记

    Coursera课程<Using Python to Access Web Data> 密歇根大学 Week6 JSON and the REST Architecture 13.5 Ja ...

  2. 【Python学习笔记】Coursera课程《Using Python to Access Web Data 》 密歇根大学 Charles Severance——Week2 Regular Expressions课堂笔记

    Coursera课程<Using Python to Access Web Data > 密歇根大学 Charles Severance Week2 Regular Expressions ...

  3. 【网页开发学习】Coursera课程《面向 Web 开发者的 HTML、CSS 与 Javascript》Week1课堂笔记

    Coursera课程<面向 Web 开发者的 HTML.CSS 与 Javascript> Johns Hopkins University Yaakov Chaikin Week1 In ...

  4. 《Using Python to Access Web Data》 Week3 Networks and Sockets 课堂笔记

    Coursera课程<Using Python to Access Web Data> 密歇根大学 Week3 Networks and Sockets 12.1 Networked Te ...

  5. 数据科学家:神话 &amp; 超能力持有者

    一个打破神话的季节,正在降临.        我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,宛如将一个又一个的玻璃瓶子摔碎在墙壁上一样.        关于数据 ...

  6. 《Using Python to Access Web Data》Week4 Programs that Surf the Web 课堂笔记

    Coursera课程<Using Python to Access Web Data> 密歇根大学 Week4 Programs that Surf the Web 12.3 Unicod ...

  7. 《Using Python to Access Web Data》 Week5 Web Services and XML 课堂笔记

    Coursera课程<Using Python to Access Web Data> 密歇根大学 Week5 Web Services and XML 13.1 Data on the ...

  8. 【DeepLearning学习笔记】Coursera课程《Neural Networks and Deep Learning》——Week2 Neural Networks Basics课堂笔记

    Coursera课程<Neural Networks and Deep Learning> deeplearning.ai Week2 Neural Networks Basics 2.1 ...

  9. 【DeepLearning学习笔记】Coursera课程《Neural Networks and Deep Learning》——Week1 Introduction to deep learning课堂笔记

    Coursera课程<Neural Networks and Deep Learning> deeplearning.ai Week1 Introduction to deep learn ...

随机推荐

  1. 系统管理员需知:25个Linux服务器安全技巧(转)

    来源:51CTO 作者:51CTO       大家都认为 Linux 默认是安全的,我大体是认可的 (这是个有争议的话题).Linux默认确实有内置的安全模型.你需要打开它并且对其进行定制,这样才能 ...

  2. [OS] 多线程--第一次亲密接触CreateThread与_beginthreadex本质区别

    转自:http://blog.csdn.net/morewindows/article/details/7421759 本文将带领你与多线程作第一次亲密接触,并深入分析CreateThread与_be ...

  3. 【bzoj3545/bzoj3551】[ONTAK2010]Peaks/加强版 Kruskal+树上倍增+Dfs序+主席树

    bzoj3545 题目描述 在Bytemountains有N座山峰,每座山峰有他的高度h_i.有些山峰之间有双向道路相连,共M条路径,每条路径有一个困难值,这个值越大表示越难走,现在有Q组询问,每组询 ...

  4. BZOJ4736 温暖会指引我们前行(LCT+最大生成树)

    类似于瓶颈路,满足条件的路径一定在温度的最大生成树上,那么就是一个LCT维护MST的裸题了. #include<iostream> #include<cstdio> #incl ...

  5. html页面导入文件 使用include后多出一空白行的解决

    用include引入的footer和header文件都在上面多出一空白行,是Unicode签名(bom)引起的. “标题/编码”,把 包括unicode签名(bom) 的勾取消就好了.

  6. Creator开源游戏、插件、教程、视频汇总

    Creator开源游戏.插件.教程.视频汇总 来源 http://forum.cocos.com/t/creator/44782 王哲首席客服   17-03-17    4   史上最全,没有之一. ...

  7. BZOJ1878:[SDOI2009]HH的项链——题解

    http://www.lydsy.com/JudgeOnline/problem.php?id=1878 题面源于洛谷 题目背景 无 题目描述 HH 有一串由各种漂亮的贝壳组成的项链.HH 相信不同的 ...

  8. nowcoder OI 周赛 最后的晚餐(dinner) 解题报告

    最后的晚餐(dinner) 链接: https://www.nowcoder.com/acm/contest/219/B 来源:牛客网 题目描述 \(\tt{**YZ}\)(已被和谐)的食堂实在是太挤 ...

  9. android getpost代码

    GetPostUtil public class GetPostUtil { /** * 向指定URL发送GET方法的请求 * * @param url * 发送请求的URL * @param par ...

  10. Widows与linux关于隐形文件和非隐形文件の对比

    Widows与linux关于隐形文件和非隐形文件の对比 对于windows来说 ,它本身有一些隐藏文件,为了防止一些菜鸟不小心把电脑的主要文件删除,还有就是里面存放一些你不知道的后门. 对此我们一些同 ...