参考: 陈天奇-"XGBoost: A Scalable Tree Boosting System" Paper地址: <https://arxiv.org/abs/1603.02754 文哲大佬全程手推 兄弟们, 再来手撸一波XGBoost, 这上半月目标算达成了. 感觉比上次撸 SVM 还是要难一些的. 但必须手撸, 因为, 近两年, 我已认识到, 很多梦魇, 只有从源头上彻底消灭后, 便不会时常萦绕心灵... 一边看原paper 和贪心地搬运大佬的知识,化为己有, 其乐无穷…
Alink漫谈(十一) :线性回归 之 L-BFGS优化 目录 Alink漫谈(十一) :线性回归 之 L-BFGS优化 0x00 摘要 0x01 回顾 1.1 优化基本思路 1.2 各类优化方法 0x02 基本概念 2.1 泰勒展开 如何通俗推理? 2.2 牛顿法 2.2.1 泰勒一阶展开 2.2.2 泰勒二阶展开 2.2.3 高维空间 2.2.4 牛顿法基本流程 2.2.5 问题点及解决 2.3 拟牛顿法 2.4 L-BFGS算法 0x03 优化模型 -- L-BFGS算法 3.1 如何分布…
无论是学习信号处理,还是做图像.音视频处理方面的研究,你永远避不开的一个内容,就是傅里叶变换和小波.但是这两个东西其实并不容易弄懂,或者说其实是非常抽象和晦涩的! 完全搞懂傅里叶变换和小波,你至少需要知道哪些预备知识?主页君从今天开始就将通过一些列文章告诉你他们之间的来龙去脉!本节是全部系列文章的第一节--总纲,日后我们也将按照这个思路一点一点讲述所有的知识.需要说明的是,本文主要面向计算机专业或者电子信息专业的读者,为此我们将尽量采取一些非常非常基础的知识来帮助你理解.所以,题目里面讲的"完全…
GBDT算法原理深入解析 标签: 机器学习 集成学习 GBM GBDT XGBoost 梯度提升(Gradient boosting)是一种用于回归.分类和排序任务的机器学习技术,属于Boosting算法族的一部分.Boosting是一族可将弱学习器提升为强学习器的算法,属于集成学习(ensemble learning)的范畴.Boosting方法基于这样一种思想:对于一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独的判断要好.通俗地说,就是"三个臭皮匠顶个…
如果在我们的分类问题中,输入特征$x$是连续型随机变量,高斯判别模型(Gaussian Discriminant Analysis,GDA)就可以派上用场了. 以二分类问题为例进行说明,模型建立如下: 样本输入特征为\(x\in\mathbb{R}^n\),其类别\(y\in\{0,1\}\): 样本类别\(y\)服从参数为\(\phi\)的伯努力分布,即\(y\sim Bernoulli(\phi)\): 两类样本分别服从不同的高斯分布,即\(x|y=0\sim\mathcal{N}(\mu_…
分类(Classification)与回归都属于监督学习,两者的唯一区别在于,前者要预测的输出变量\(y\)只能取离散值,而后者的输出变量是连续的.这些离散的输出变量在分类问题中通常称之为标签(Label). 线性回归的策略同样也适用于分类吗?答案是否定的.下面结合例子简要说明理由.假设我们现在的任务是根据肿瘤大小判断是否为良性肿瘤,答案当然只有yes或no.我们用\(y=1\)表示良性肿瘤,用\(y=0\)表示恶性肿瘤.当然,如果你想用其他两个不同的值分别对应这两类肿瘤也是可以的.在下图所示的…
  支持向量机(Support Vector Machine,简称 SVM)于 1995 年正式发表,由于其在文本分类任务中的卓越性能,很快就成为机器学习的主流技术.尽管现在 Deep Learning 很流行,SVM 仍然是一种很有的机器学习算法,在数据集小的情况下能比 Deep Learning 取得更好的结果.   本文将详细介绍线性 SVM,非线性 SVM 涉及到的 kernel,本文中没有介绍.我将从以下两个方面展开介绍线性 SVM: 间隔和支持向量 对偶问题 1. 间隔和支持向量  …
设 $f(x)$ 二阶连续可导, $f(0)=f(1)=0$, $\dps{\max_{0\leq x\leq 1}f(x)=2}$. 证明: $$\bex \min_{0\leq x\leq 1}f''(x)\leq -16. \eex$$ 证明: 设 $$\bex \xi\in (0,1),\st f(\xi)=\max_{0\leq x\leq 1}f(x)=2\ra f'(\xi)=0. \eex$$ 在 $\xi$ 处由 Taylor 展式, $$\beex \bea 0=f(0)=f…
前言: 这是一篇面向对象作业总结,作业内容是对多项式进行求导,一共有三个阶段,具体要求不详述,第一阶段只要求’+’连接coeff*x^pow的形式,第二次支持*连接的幂函数及三角函数,第三次则需要支持括号表达式的嵌套.本想不用编译原理所述表达式树,最后发现做成一团乱麻. 第一次作业 类图如下: 说明:第一次作业比较简易,主要是对新版eclipse和checkstyle的安装和熟悉.词法分析器为Token,可以考虑将其单例化,因为只有一个词法分析器.用Poly存储多项式的系数和幂次,在PolyDi…
目录 1.问题描述 1.1.概念定义 7.程序度量 8.知识点笔记 1.运行 2.1.方法 2.2.检测相等性 2.3.空串与null串 2.4.使用StringBuilder构建字符串 2.5.使用正则表达式判断和修改内容 2.6.转换为字符串 3.2.输出 3.3.文件IO 4.控制结构 4.1.块作用域 4.2.条件语句 4.3.循环语句 4.4.跳转语句 5.标识符 5.1.类名 5.2.常量名 6.方法 6.1.调用 8.数据类型 8.1.整型 8.5.类型转换 8.6.char型 9…