数学似宇宙,韭菜只关心其中实用的部分。

scikit-learn (sklearn) 官方文档中文版

scikit-learn Machine Learning in Python

一个新颖的online图书资源集,非常棒。

机器学习原理

Bayesian Machine Learning


9. [Bayesian] “我是bayesian我怕谁”系列 - Gaussian Process【ignore】

随机过程

[Scikit-learn] 1.1 Generalized Linear Models - Bayesian Ridge Regression【等价效果】

8. [Bayesian] “我是bayesian我怕谁”系列 - Variational Autoencoders

稀疏表达

[UFLDL] Generative Model

[UFLDL] *Sparse Representation【稀疏表达】

7. [Bayesian] “我是bayesian我怕谁”系列 - Boltzmann Distribution【ignore】

贝叶斯网络

[Scikit-learn] Dynamic Bayesian Network - Conditional Random Field【去噪、词性标注】

6. [Bayesian] “我是bayesian我怕谁”系列 - Markov and Hidden Markov Models【隐马及其扩展】

时序模型

[Scikit-learn] Dynamic Bayesian Network - HMM【基础实践】

[Scikit-learn] Dynamic Bayesian Network - Kalman Filter【车定位预测】

[Scikit-learn] *Dynamic Bayesian Network - Partical Filter【机器人自我定位】

5. [Bayesian] “我是bayesian我怕谁”系列 - Continuous Latent Variables【降维:PCA, PPCA, FA, ICA】

概率降维

[Scikit-learn] 4.4 Dimensionality reduction - PCA

[Scikit-learn] 2.5 Dimensionality reduction - Probabilistic PCA & Factor Analysis

[Scikit-learn] 2.5 Dimensionality reduction - ICA

[Scikit-learn] 1.2 Dimensionality reduction - Linear and Quadratic Discriminant Analysis

4. [Bayesian] “我是bayesian我怕谁”系列 - Variational Inference【公式推导解读】

概率聚类

[Scikit-learn] 2.1 Clustering - Gaussian mixture models & EM

[Scikit-learn] 2.1 Clustering - Variational Bayesian Gaussian Mixture

3. [Bayesian] “我是bayesian我怕谁”系列 - Latent Variables【概念解读】

隐变量模型

[Bayes] Concept Search and LSI

[Bayes] Concept Search and PLSA

[Bayes] Concept Search and LDA

2. [Bayesian] “我是bayesian我怕谁”系列 - Exact Inference【ignore】

1. [Bayesian] “我是bayesian我怕谁”系列 - Naive Bayes with Prior【贝叶斯在文本分类的极简例子】

朴素贝叶斯

[ML] Naive Bayes for Text Classification【原理概览】

[Bayes] Maximum Likelihood estimates for text classification【代码实现】

[Scikit-learn] 1.9 Naive Bayes【不同先验的朴素贝叶斯】

常见分布关系

<Statistical Inference> goto: 647/686

先验分布与后验分布

[Math] From Prior to Posterior distribution【先验后验基础知识】

[Bayes] qgamma & rgamma: Central Credible Interval【后验区间估计】

[Bayes] Multinomials and Dirichlet distribution【狄利克雷分布】

其中两个概念比较重要:

      • 无信息先验分布 (Non-informative prior)
      • Jeffreys先验分布 (Jeffreys  prior)

后验即是:贝叶斯统计推断

      • 后验分布与充分性 (Posterior distribution and sufficiency)
      • 无信息先验下的后验分布 (Posterior distribution with noninformative prior)
      • 共轭先验下的后验分布 (Posterior distribution with conjugate prior)

结合损失函数:贝叶斯统计决策 

      • 平方损失 (square loss)
      • 加权平方损失 (weighted squared loss)
      • 绝对值损失 (absolute loss)
      • 线性损失函数 (linear loss function)

抽样方法

一种逼近求值策略:贝叶斯计算方法

    • MCMC抽样方法

[Bayes] MCMC (Markov Chain Monte Carlo)【利用了马尔科夫的平稳性】

(a).  Metropolis-Hasting算法

(b).  Gibbs采样算法

其他未整理

non-Bayesian Machine Learning


Algorithm Outline

[ML] Roadmap: a long way to go【学习路线北斗导航】

基本概念

[UFLDL] Basic Concept【基本ML概念】

[UFLDL] *Train and Optimize

基本算法

[Scikit-learn] 1.5 Generalized Linear Models - SGD for Regression

[Scikit-learn] 1.5 Generalized Linear Models - SGD for Classification

Online Learning

[Scikit-learn] 1.1 Generalized Linear Models - Comparing various online solvers

[Scikit-learn] Yield miniBatch for online learning.

线性问题

[UFLDL] Linear Regression & Classification

线性拟合

[Scikit-learn] 1.1 Generalized Linear Models - from Linear Regression to L1&L2【最小二乘 --> 正则化】

[Scikit-learn] 1.1 Generalized Linear Models - Lasso Regression【L2相关“内容”,正则化分类当然也可以用】

[ML] Bayesian Linear Regression【增量在线学习的例子】

[Scikit-learn] 1.4 Support Vector Regression【依据最外边距】

[Scikit-learn] Theil-Sen Regression【抗噪能力较好】

线性分类

# Discriminative Models

[Scikit-learn] 1.1 Generalized Linear Models - Logistic regression & Softmax【转化为最大似然,也可以将参数“正则”】

[Scikit-learn] 1.1 Generalized Linear Models - Neural network models【MLP多层感知机】

[ML] Bayesian Logistic Regression【统计分类方法的区别】

[Scikit-learn] 1.4 Support Vector Regression【线性可分】

# Generative Models

Naive Bayes【参见 "贝叶斯机器学习"】

[ML] Linear Discriminant Analysis【ing】

决策树

[ML] Decision Tree & Ensembling Metholds【Bagging pk Boosting pk SVM】

降维

[UFLDL] Dimensionality Reduction【广义降维方法概述】

聚类

[Scikit-learn] 2.3 Clustering - kmeans

[Scikit-learn] 2.3 Clustering - Spectral clustering

[Scikit-learn] *2.3 Clustering - DBSCAN: Density-Based Spatial Clustering of Applications with Noise

[Scikit-learn] *2.3 Clustering - MeanShift

End.

[AI] 深度数学 - Bayes的更多相关文章

  1. AI - 深度学习之美十四章-概念摘要(8~14)

    原文链接:https://yq.aliyun.com/topic/111 本文是对原文内容中部分概念的摘取记录,可能有轻微改动,但不影响原文表达. 08 - BP算法双向传,链式求导最缠绵 反向传播( ...

  2. 一文看懂AI深度学习丨曼孚科技

    深度学习(Deep Learning)是机器学习的一种,而机器学习是实现人工智能的必经途径. 目前大部分表现优异的AI应用都使用了深度学习技术,引领了第三次人工智能的浪潮. 一. 深度学习的概念 深度 ...

  3. AI - 深度学习之美十四章-概念摘要(1~7)

    原文链接:https://yq.aliyun.com/topic/111 本文是对原文内容中部分概念的摘取记录,可能有轻微改动,但不影响原文表达. 01 - 一入侯门"深"似海,深 ...

  4. AI 深度生成模型

    深度生成模型 1.玻尔兹曼机

  5. AI与数学笔记之深入浅出的讲解傅里叶变换(真正的通俗易懂)

    原文出处: 韩昊    # 作 者:韩 昊 # 知 乎:Heinrich # 微 博:@花生油工人 # 知乎专栏:与时间无关的故事 # 谨以此文献给大连海事大学的吴楠老师,柳晓鸣老师,王新年老师以及张 ...

  6. [AI] 深度数据 - Data

    Data Engineering Data  Pipeline Outline [DE] How to learn Big Data[了解大数据] [DE] Pipeline for Data Eng ...

  7. [Pandas] 05 - Parallel processing

    相关资源 [Python] 09 - Multi-processing [Pandas] 01 - A guy based on NumPy [AI] 深度数学 - Bayes 这章非常有意思,但一定 ...

  8. [Feature] Final pipeline: custom transformers

    有视频:https://www.youtube.com/watch?v=BFaadIqWlAg 有代码:https://github.com/jem1031/pandas-pipelines-cust ...

  9. 深度学习哪家强?吴恩达、Udacity和Fast.ai的课程我们替你分析好了

    http://www.jianshu.com/p/28f5473c66a3 翻译 | AI科技大本营(rgznai100) 参与 | reason_W 引言 过去2年,我一直积极专注于深度学习领域.我 ...

随机推荐

  1. python_反射:应用

    class User(object): def denglu(self): print('欢迎来到登录页面!') def zhuce(self): print('欢迎来到注册页面!') def you ...

  2. Nginx 做JavaWeb负载均衡

    随着用户量的增大,单台服务器已经满足不了用户的需求. 准备工作:安装 gcc.pcre-devel.zlib.OpenSSL 一下是在线   离线请戳这里 gcc 安装安装 nginx 需要先将官网下 ...

  3. myeclipse不同版本共存破解办法

    我自己破解的是myeclipse10+myeclipse2018: 方法是:先破解myeclipse10.7,使用破解工具,到最后一步不关闭破解工具,再进行替换文件那一步,路径不选择10版本的,换成M ...

  4. sudo 命令报 unable to resolve host 导致反应速度变慢

    1 分析 1.1 字面分析,不能解析主机 1.2 由于修改了本地主机名称所导致 2 解决 2.1 打开 /etc/hosts 2.2 主机名称指向,如你的主机名为 debian 2.3  127.0. ...

  5. 071_关闭 SELinux

    #!/bin/bashsed -i '/^SELINUX/s/=.*/=disabled/' /etc/selinux/configsetenforce 0

  6. java文件上传下载组件

    需求: 支持大文件批量上传(20G)和下载,同时需要保证上传期间用户电脑不出现卡死等体验: 内网百兆网络上传速度为12MB/S 服务器内存占用低 支持文件夹上传,文件夹中的文件数量达到1万个以上,且包 ...

  7. CF280C Game on Tree 概率与期望

    利用期望的线性性,即 $E(a+b)=E(a)+E(b)$. 对于所有点分别求一下期望然后累加即可. code: #include <bits/stdc++.h> #define N 10 ...

  8. linux系列(三):pwd命令

    1.命令格式: pwd [选项] 2.命令功能 查看”当前工作目录“的完整路径 3.常用参数 -L:显示当前路径,有连接文件时,直接显示连接文件的路径(不加参数时默认此方式) -P:显示当前的路径,有 ...

  9. 在默认使用apache中央仓库时, 报错 protocol_version

    https://cloud.tencent.com/developer/ask/136221/answer/241408 2018年6月,为了提高安全性和符合现代标准,不安全的TLS 1.0和1.1协 ...

  10. linux经常用的命令

    常用 安装包   centos   yum    /   Ubuntu  Debian  apt-get clear :清空终端       [cmd 下是cls] vi/vim  编辑器    详情 ...