<breakthroughs in statistics>- 这本书理解透了,统计方面应该可以封神了. 亚马逊上有卖,貌似还有好几卷. Breakthroughs in Statistics: Vol 3 (Springer Series in Statistics)…
摘要:Wright’s F‑statistics, and especially FST, provide important insights into the evolutionary processes that influence the structure of genetic variation within and among populations, and they are among the most widely used descriptive statistics in…
餐具:coffee pot 咖啡壶coffee cup 咖啡杯paper towel 纸巾napkin 餐巾table cloth 桌布tea -pot 茶壶tea set 茶具tea tray 茶盘caddy 茶罐dish 碟plate 盘saucer 小碟子rice bowl 饭碗chopsticks 筷子soup spoon 汤匙knife 餐刀cup 杯子glass 玻璃杯mug 马克杯picnic lunch 便当fruit plate 水果盘toothpick 牙签中餐:bear's…
http://www.cnblogs.com/shanyou/archive/2013/02/12/2910232.html SQL Server Performance Dashboard Reports是一组Reporting Services的报表,和SQL Server Management Studio中所介绍的报表一起使用.这些报表允许数据库管理员快速地确定他们的系统中是否存在瓶颈,瓶颈是否正在发生,捕获这些附加的诊断数据可能会对解决问题更有帮助.例如,系统正在等待disk IO,这…
作者原文链接 想掌握Python标准库,读它的官方文档很重要.本文并非此文档的复制版,而是对每一个库的一句话概括以及它的主要函数,由此用什么库心里就会有数了. 文本处理 string: 提供了字符集:ascii_lowercase, ascii_uppercase re: 正则表达式支持(pattern, string):match, search, findall, sub, split, finditer difflib: 序列的差异化比较: context_diff(s1, s2) 数据结…
MIT一牛人对数学在机器学习中的作用给的评述 转载自http://my.oschina.net/feedao/blog/52252,不过这个链接也是转载的,出处已经无从考证了.   感觉数学似乎总是不够的.这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书.   从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识.Learning和Vision都是很多种数学的交汇场.看着不同的理论体系的交汇,对于一个researcher来说,…
Machine learning Machine learning is a scientific discipline that explores the construction and study of algorithms that can learn from data. Such algorithms operate by building a model based on inputs and using that to make predictions or decisions,…
推断统计学(Inferential Statistics):利用样本信息对总体进行估计和假设检验. 总体(population):在一个特定研究中所有感兴趣的个体组成的集合. 样本(sample):总体的一个子集. 样本统计量(sample statistics):样本数据的计算度量. 总体参数(population parameters):总体数据的计算度量. 普查(census):搜集总体全部数据的调查过程. 抽样调查(sampling survey):搜集样本数据的调查过程. 点估计量(p…
 引言 Introduction 需要特别说明,spm是每一个体素为单位,计算统计量,进行t检验. 1.分别在每个体素上做方差分析; 2.对每个体素的方差分析结果,计算t检验统计量; 3.计算等同于t检验统计量的z值; 4.绘制一副t检验统计量map,或者z值map; 5.利用随机场理论,纠正统计检验结果的显著性水平. 命名说明 Naming of parts observation = a voxel value, in the voxel we are analysing, for one…
描述统计学(Descriptive Statistics):将数据的信息以表格, 图形或数值的形式进行汇总. 数据类型:分为定量数据(数值型数据)和定性数据(类别型数据).数值型数据又可以分为连续型和离散型,类别型数据又可以分为有序型和无序型. 定性数据: 频数(frequency):数据出现的次数. 相对频数(relative frequency):数据出现的次数/总次数. 百分数(percentage):数据出现的次数/总次数*100%. 定量数据: 平均数(mean):总数值除以总数.总体…
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share http://www.kancloud.cn/wizardforcel/scipy-lecture-notes/129877参考 In [1]: %mat…
已知数据x,希望得到未知label y,即得到映射x-->y: 几个概念: 1)p(x): data distribution 数据分布 2)p(y): prior distribution 先验分布 a priori: Knowable without appeal to particular experiencea priori distribution: special meaning, do not misuse 3)p(x, y): join distribution 联合分布 4…
The Lady Tasting Tea - How Statistics Revolutionized Science in the Twentieth Century 本书只讨论了20世纪这100年间的统计大变革. 一般的书读读就行,唯独这本书需要慢慢品读,让统计的思想深入骨髓. 这本书不适合空读,而要结合自己对统计学的理解来读,遇到不懂的时候不要跳过,停下来仔细查阅相关资料,而后一旦理解了书中的总结,就很难忘记了. 需要做的事: 深刻揣摩每段历史中核心的统计学问题: 整理书中的天才们,出现…
又忙了一周多,今天过来再整理一些东西.国内做产险精算的,准备金的居多,从精算部落中的帖子的跟帖情况可见一斑.既然准备金更容易受到大家的关注,今天再整理一个关于准备金的个人看法,给精算部落收敛一下人气,呵呵   究竟产险业务准备金怎么做?三角形方法就是所谓的精算方法吗?这不就是统计方法吗?与统计方法有什么区别呢?这些问题是我听过的来自非精算圈的最多的问题.客观地讲,仅仅是个人看法,估计很多同仁不认同,传统的三角形方法的确是基于统计预测的方法,很多学过统计的人士看过三角形后,就能够知道其中的含义.记…
Spark MLlib提供了一些基本的统计学的算法,下面主要说明一下: 1.Summary statistics 对于RDD[Vector]类型,Spark MLlib提供了colStats的统计方法,该方法返回一个MultivariateStatisticalSummary的实例.他封装了列的最大值,最小值,均值.方差.总数.如下所示: val conf = new SparkConf().setAppName("Simple Application").setMaster(&quo…
3. Bayesian statistics and Regularization Content 3. Bayesian statistics and Regularization. 3.1 Underfitting and overfitting. 3.2 Bayesian statistics and regularization. 3.3 Optimize Cost function by regularization. 3.3.1 Regularized linear regressi…
二项分布 | Binomial distribution 泊松分布 | Poisson Distribution 正态分布 | Normal Distribution | Gaussian distribution 负二项分布  | Negative binomial distribution 指数分布 | Exponential Distribution Βeta分布 | beta distribution Βeta二项分布 | Beta-binomial distribution 几何分布…
2月22日更新:   0.Python从零开始系列连载: Python从零开始系列连载(1)——安装环境 Python从零开始系列连载(2)——jupyter的常用操作 Python从零开始系列连载(3)——Python的基本数据类型(上) Python从零开始系列连载(4)——Python的基本数据类型(下) Python从零开始系列连载(5)——Python的基本运算和表达式(上) Python从零开始系列连载(6)——Python的基本运算和表达式(下) Python从零开始系列连载(7)…
MYSQL的历史 见证MySQL发展历程 各分支版本溯源 http://tech.it168.com/a2012/0621/1363/000001363446.shtml [IT168 技术]毫无疑问,目前MySQL已经成为最为流行的开源关系数据库系统,并且一步一步地占领了原有商业数据库的市场.可以看到Google.Facebook.Yahoo.网易.久游等大公司都在使用MySQL数据库,甚至将其作为核心应用的数据库系统.而MySQL数据库也不再仅仅应用于Web项目,其扮演的角色更为丰富.在网络…
<Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress出版年: 2016-12-29页数: 804定价: USD 59.99装帧: PaperbackISBN: 9781484219638 统计 SQL Server查询优化器在为查询选择执行计划时使用基于成本的模型.它估计不同执行计划的成本,并选择成本最低的一个.但是,请记住,SQL Server并不搜索查询可用的最佳执行计划,因为评估所有可能的替代方案在CPU方面都是耗时…
回我们初次见识了统计学理论中的“独孤九剑”——贝叶斯统计学(戳这里回顾),它的起源便是大名鼎鼎的贝叶斯定理. 整个贝叶斯统计学的精髓可以用贝叶斯定理这一条式子来概括: 我们做数据分析,绝大多数情况下希望得到的是关于某种假说是否成立的信息.等式左边的P(参数 | 数据),正是在观察到了手头上的数据的前提下,假说成立的概率.这里的“参数”,只不过是描述我们感兴趣的假说的数字而已. 比如说,在第1集<你真的懂p值吗?>里(戳这里回顾),蓝精灵抛一枚钢蹦儿,想知道它是不是均匀的.那么,关于钢镚儿是否均…
T distribution 定义 在概率论和统计学中,学生t-分布(t-distribution),可简称为t分布,用于根据小样本来估计 呈正态分布且方差未知的总体的均值.如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值. In probability and statistics, Student's t-distribution (or simply the t-distribution) is any member of a family of continuo…
1. https://www.pythian.com/blog/statistics-gathering-and-sql-tuning-advisor/ Our monitoring software found a long running job on one of our client’s databases. The job was an Oracle’s auto task running statistics gathering for more than 3 hours. I wa…
Common sense reduced to computation - Pierre-Simon, marquis de Laplace (1749–1827) Inventor of Bayesian inference 贝叶斯方法的逻辑十分接近人脑的思维:人脑的优势不是计算,在纯数值计算方面,可以说几十年前的计算器就已经超过人脑了. 人脑的核心能力在于推理,而记忆在推理中扮演了重要的角色,我们都是基于已知的常识来做出推理.贝叶斯推断也是如此,先验就是常识,在我们有了新的观测数据后,就可以…
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 机器学习,统计项目联系QQ:231469242 两个配对样本,均匀分布,非正太分布 Wilcoxon signed-rank test 曼-惠特尼U检验M…
SPSS分析技术:无序多元Logistic回归模型:美国总统大选的预测历史及预测模型 在介绍有序多元Logistic回归分析的理论基础时,介绍过该模型公式有一个非常重要的假设,就是自变量对因变量多个类别(因变量是定序数据)的影响程度是相同的.如果因变量有4个水平,那么有序多元逻辑回归分析最终会产生3个回归方程,这些回归方程除了常数项以外,其余的部分都是一样的,这就体现了模型的假设.因为有这个假设的存在,所以做有序多元Logistic回归分析时,可以同时输出平行性检验结果.如果检验结果不通过,那么…
IBM SPSS Statistics 26.0是IBM公司推出的一款用于统计学分析运算.数据挖掘.预测分析和决策支持任务的软件产品及相关服务的程序. 下载 windows/mac/linux IBM SPSS Statistics 26.0 安装包 &pojie包: 微xin功重好 A酷君 回复 spss 获取! 需要下载安装包和pojie包,根据自己的操作系统选择对应的安装包下载,如:windows 64位系统就下载图中第2个... pojie包是一定要下载的,即图中第1个 安装教程 Win…
Crash course statistics 01什么是统计学 描述性统计(Descriptive statistics) 推理统计可以得出之外的,基于"样本"的推论统计学来估计整体总量.在推理统计中存在一定程度的不确定性,他只能告诉你某件事情的可能性有多大,我们的工作就是利用这些信息去做出决策,即使存在不确定性. 比如说一个篮子里有许多水果糖,如果你一个一个的数,去统计其口味就是描述性统计.但是如果你的篮子里的水果打乱了,足够随机,你可以使用一小部分来代替大部分,利用基于样本的推论…
在移动开发领域我们发现一个很奇怪的现象:普通菜鸟新手经过3个月的培训就可以拿到 8K 甚至上万的工作:在北京稍微有点工作经验的 iOS 开发,就要求 2 万一个月的工资.不知道大家是否想过:移动应用开发已经在市场上火热了这么多年了,为什么很多公司还仍然会面临移动开发人才稀缺的问题呢?对于移动开发人才的增长速度总是赶不上市场需求发展的原因,我认为不应该简单归为市场供求关系的问题,其源动力还是来自移动应用整体的开发模式和开发效率低下的内因.正是这强大的市场需求和低下的原生开发效率结合在一起才导致了这…
title: 清空Github上某个文件的历史版本 author: 青南 date: 2015-01-08 16:04:53 categories: [经验] tags: [Github,history] --- 文章首发地址:http://kingname.info 今天在Github更新代码的时候,不小心把Gmail私钥文件更新上去了.即便我立刻删除了这个文件,可是在版本历史里面仍然可以看到这个文件的内容.这可把我吓坏了. Google一圈以后,终于找到了解决办法.把某个文件的历史版本全部清…