20世纪初意大利经济学家基尼,于1922年提出的定量测定收入分配差异程度的指标.它是根据洛伦茨曲线找出了判断分配平等程度的指标(如下图). 设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B.并以A除以A+B的商表示不平等程度.这个数值被称为基尼系数或称洛伦茨系数.如果A为零,基尼系数为零,表示收入分配完全平等:如果B为零则系数为1,收入分配绝对不平等.该系数可在零和1之间取任何值.收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越…
洛伦茨吸引子是洛伦茨振子(Lorenz oscillator)的长期行为对应的分形结构,以爱德华·诺顿·洛伦茨的姓氏命名. 洛伦茨振子是能产生混沌流的三维动力系统,是一种吸引子,以其双纽线形状而著称. 映射展示出动力系统(三维系统的三个变量)的状态是如何以一种复杂且不重复的模式,随时间的推移而演变的. 当ρ(m_ParamB)值较小时,系统是稳定的,并能演变为两个定点吸引子中的一个: 当ρ(m_ParamB)大于24.28时,定点变成了排斥子,会以非常复杂的方式排斥轨迹,演变时自身从不交叉. 相…
目录 决策树简单描述 衡量purity的三种方法 Gini Coefficient Entropy熵 决策树简单描述 决策树的样子大概是这个样子的: 选择一个特征作为根节点,把这个特征划分成两个孩子节点,每个孩子节点就是原始数据集的子集,然后再找一个特征作为划分-- 划分的好坏,如图所示: 用纯度Purity来衡量划分的效果,如果划分的好,那么每一个子集都是某一类占据大多数,如果每一个子集都是跟父节点一样的状态,那么就是Low purity. 一个好的划分要满足下面两个特点: 划分是High p…
[原创]继续我的项目研究,现在采用Libjpeg库函数来进行处理,看了库函数之后发现C语言被这些人用的太牛了,五体投地啊...废话不多说,下面就进入正题. Libjpeg库在网上下载还是挺方便的,这里就不附上来了,当然如果找不到的话,也可以发邮件给我,我的邮箱是gungnir2011@gmail.com. 打开库函数会看到有很多很多的文件,里面有两个解决方案,一个是apps,一个是jpeg.apps里面有5个工程,分别是用于压缩,解压,转换,读取JPEG中COM段,写入JPEG中COM段,COM…
Introduction to Random forest(Simplified) With increase in computational power, we can now choose algorithms which perform very intensive calculations. One such algorithm is “Random Forest”, which we will discuss in this article. While the algorithm…
 sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share Toby,项目合作QQ:231469242 随机森林就是由多个决策树组合而成的投票机制. 理解随机森林,要先了解决策树 随机森林是一个集成机器学习算法…
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 医药统计项目可联系  QQ:231469242     决策树优点和缺点 决策树优点 1.简单易懂,很好解读,可视化 2.可以变量筛选 缺点 1.决策树…
论文:      Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market 发表期刊:Science 2006 作者:       Matthew J. Salganik, Peter Sheridan Dodds, Duncan J. Watts 单位:     Columbia University 原文链接:http://science.sciencemag.org/cont…
简介 CART树即分类回归树(classification and regression tree),顾名思义,它即能用作分类任务又能用作回归任务,它的应用比较广泛,通常会用作集成学习的基分类器,总得来说,它与ID3/C4.5有如下不同: (1)它是一颗二叉树: (2)特征选择的方法不一样,CART分类树利用基尼系数做特征选择,CART回归树利用平方误差做特征选择: 接下来,分别对CART分类树和回归树做介绍 CART分类树 首先介绍特征选择方法,基尼系数: \[Gini(p)=\sum_{k=…
在Bagging与随机森林算法原理小结中,我们对随机森林(Random Forest, 以下简称RF)的原理做了总结.本文就从实践的角度对RF做一个总结.重点讲述scikit-learn中RF的调参注意事项,以及和GBDT调参的异同点. 1. scikit-learn随机森林类库概述 在scikit-learn中,RF的分类类是RandomForestClassifier,回归类是RandomForestRegressor.当然RF的变种Extra Trees也有, 分类类ExtraTreesC…