Machine Learning方法总结

Kmeans——不断松弛(？我的理解)模拟，将点集分成几堆的算法(堆数需要自己定)。
局部加权回归(LWR)——非参数学习算法，不用担心自变量幂次选择。(因此当二次欠拟合，三次过拟合的时候不妨尝试这种办法)
逻辑回归Logistic Regression(Sigmoid)——分类问题的常用拟合函数。
1. 对于有多个类的分类问题，怎么办？(比如手写板识别，一共0~9十个类别)——转换为独热码(0100000000)，计算cost function之和。
2. 一个带Excel读取，和训练之后检测的分类问题模板(以建模校赛2018为数据源)
3. 简单的线性逻辑回归效果不好怎么办？(线性神经网络同理)——将数据集离散化(如分段取相同的值，1~9.9 = 5)以产生非线性，从而使结果更准确——你也可以称之为：离散数学处理。
4. sklearn中的SVR也可以用来解决回归问题
支持向量机(SVM)——另一种分类问题的常用方法。定义分界线与数据集之间的“间隔”，通过最大化间隔来产生较好的分类效果。
1. SVM与逻辑回归分别适用的场景？
  1. SVM采用数学方法；逻辑回归采用统计方法。
  2. SVM对数据集的敏感度非常高，如果出现错误数据或噪音数据，影响非常大；逻辑回归则不敏感。
  3. 特征数量相对较少而样本充足时，尽量用SVM以获得更准确的结果；特征数量较多时，则使用LR，特征数量已经较多，线性可以很好拟合，且速度更快。
Word2Vec——高级的语义分析算法，将单词转化为一个多维的向量，可以根据向量之间的关系确定单词的关系(如转换后的字词向量中：猫-鱼≈狗-小狗)。
生成学习算法——预先对于P(x|y)进行建模，增加假设条件，所需数据量更少，结果更加准确。
1. 高斯判别分析(GDA)——假设x|y服从高斯分布。
PCA + T-SNE——高维数据降维可视化方法
1. Matlab实现Kmeans+PCA+T-SNE数据聚类降维可视化的例子
朴素贝叶斯(Naive Bayes)——何来Naive？：对于数据做了非常强的假设：各个参量之间相互独立。
ERM经验风险最小化——用来估计所需训练样本个数的数量级。
贝叶斯规范化——以线性模型为例，误差函数从Σ(||y(i)-θ'x(i)||^2)变成Σ(||y(i)-θ'x(i)||^2+λ||θ||^2)，即添加了对于θ模值的惩罚项，从而减少过拟合的风险。(λ的值可以通过交叉检验方法得到)。
最大期望算法(EM算法)——估计隐形变量的参数分布。

Machine Learning方法总结的更多相关文章

[LNU.Machine Learning.Question.1]梯度下降方法的一些理解
曾经学习machine learning,在regression这一节,对求解最优化问题的梯度下降方法,理解总是处于字面意义上的生吞活剥. 对梯度的概念感觉费解?到底是标量还是矢量?为什么沿着负梯度方 ...
一种压缩图片的方法---Machine learning 之 K-Means
背景描述: RGB编码:对于一个直接用24bit表示每一个而像素的图像来说,每一个pixel使用8-bit无符号整数(0-255)来表示红or绿or蓝. 压缩目的: 将128x128大小的图片由原来的 ...
machine learning(11) -- classification: advanced optimization 去求cost function最小值的方法
其它的比gradient descent快, 在某些场合得到广泛应用的求cost function的最小值的方法 when have a large machine learning problem, ...
另一种压缩图片的方法---Machine learning 之 PCA（Principle Component Analysis）
PCA最主要的用途是用来减少特征向量的数目,N个特征向量减小到 K个特征向量.如果为了可视化,k可以使3 或者 2.这样可以加速算法的学习速度. PCA用来压缩图像同一有效. 具体方式以及原理在gi ...
【Machine Learning】KNN算法虹膜图片识别
K-近邻算法虹膜图片识别实战作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
【Machine Learning】Python开发工具：Anaconda+Sublime
Python开发工具:Anaconda+Sublime 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现 ...
【Machine Learning】决策树案例：基于python的商品购买能力预测系统
决策树在商品购买能力预测案例中的算法实现作者:白宁超 2016年12月24日22:05:42 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本 ...
【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
[Machine Learning] Active Learning
1. 写在前面在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi ...

随机推荐

ext4文件系统特性浅析
ext4作为Linux下的文件系统因其简单性.易管理性.兼容性强等特定,深受大多数用户喜欢,并且作为大多数Linux发行版中的默认文件系统.但是随着现在文件数目的增多以及文件数据的增大,ext4文件系 ...
php生成word文档
使用fopen文件操作函数来做,需要注意的直接生成中文文件名会乱码,(生成word和微软的编码不一样)需要转码生成.word内容保持utf8编码就好. $file_name = iconv(" ...
OpenID Connect Core 1.0（五）使用授权码流验证（下）
3.1.2.6 验证错误响应(Authentication Error Response) 验证错误响应是一个OAuth 2.0授权错误响应消息,是RP发送授权请求的消息,由OP授权终结点的响应返回. ...
使用XWAF框架（4）——LunarCalendar日历组件
XWAF提供了管理日历的com.xwaf.date.LunarCalendar静态类,可以直接使用,非常方便.该类包括六个主要静态方法: 4.1 isLeapYear(int year) 判断公历年 ...
ThinkPHP微信扫码支付接口
最近折腾微信扫码支付,看了微信官方文档,找了很多网页,发现和文档/demo不匹配,现在自己算是弄出来了(文件名称有所更改),贴出来分享一下一.将有用的官方lib文件和使用的相关文件放置到vendor ...
docker环境下构建flannel 网络
flannel 是coreos 开发的网络解决方案,为每一台主机分配一个 subnet,容器从此subnet 中分配ip,ip可以在主机间路由.每个subnet从更大的ip池中划分,为了在各个主机间共 ...
回文词（Palindromes，Uva401）
例题 3-3 回文词 (Palindromes,Uva401) 输入一个字符中,判断它是否为回文串以及镜像串.输入字符串保证不含数字0.所谓回文串,就是反转以后和原串相同,如abba和madam.所有 ...
nodejs fastdfs
node端fastdfs客户端上传文件 var FdfsClient = require('fdfs'); var fdfs = new FdfsClient({ // tracker servers ...
Oracle入门第六天（下）——高级子查询
一.概述主要内容: 二.子查询介绍 1.简单子查询(WHERE子查询) SELECT last_name FROM employees WHERE salary > (SELECT salar ...
SSM-CRUD入门项目——删除
删除分析可以进行单个删除,直接点击每条记录后的删除按钮批量删除,通过勾选checkbox框进行选择删除单个删除: 通过发送DELETE请求的URL:/emp/{id} 这次我们先从contro ...

Machine Learning方法总结

Machine Learning方法总结的更多相关文章

随机推荐

热门专题