https://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653390110&idx=1&sn=b3e5d6e946b719d08b67d9ebf88283fe&chksm=bd1c3d0d8a6bb41bf05a8ccc9f375528c7c5e4223b190acc9593082b50e17855d2ccdd0e8ac2&mpshare=1&scene=23&srcid=0110mg1nBdOAslm4Www2cliB#rd

本文是根据 Stefan Kojouharov 发表在 Medium 上的文章整理而成的一份人工智能、神经网络、机器学习、深度学习和大数据方面的速查表。为了便于查找与使用,本文对每个主题进行了分类,希望可以对各位的工作有所帮助。

01 神经网络

02 神经网络图

图 3a:神经网络相关概念速查表(上)

图 3b:神经网络相关概念速查表(下)

03 机器学习概览

04 机器学习:Scikit-learn 算法

如果在你的项目中出现了一些未知问题,那么这份机器学习速查表可以帮助你快速地找到出问题的那部分。下面这个流程图可以帮助你快速的浏览文档并快速导航,这可以帮助你更深入的理解问题的原因,同时为你提供对应的解决方案。

图 5:机器学习速查表

05 Scikit-Learn

Scikit-learn(原 scikits.learn) 是基于 Python 的一款免费机器学习库。它涵盖了很多 分类、回归 以及 聚类 算法,包括 支持向量机、随机森林、梯度加速、k-means 聚类 以及 DBSGAN 聚类算法。该库可以与 Python 的科学计算库 Numpy 以及 SciPy 互操作。

图 6:Scikit-Learn 速查表

06 机器学习:算法速查表

这份来自微软 Azure 的机器学习速查表可以帮助你在解决方案的预分析过程中快速选择合适的机器学习算法。使用这份速查表时,你可以根据自己的目的和数据特征快速地选择对应的算法。

图 7:机器学习速查表

07 Python 的数据科学相关功能

图 8:Python 数据科学速查表

图 9:大数据速查表

08 TensorFlow

2017 年 5 月,Google 发布了第二代 TPU(张量计算单元),同时在 谷歌计算引擎 上提供了 TPU 集群。第二代 TPU 提供了高达每秒 180 万亿次的浮点数运算能力,由 64 个 TPU 组成的集群可以提供每秒 1.15 亿亿次的浮点数运算能力。

图 10:TensoFlow 速查表

09 Keras

2017 年,Google 的 TensorFlow 团队决定在 TensorFlow 的核心库中添加 Keras 支持。

Ghollet 解释说,Keras 是按接口来设计的,而不是一个端到端的机器学习框架。它代表着更高级、更直观的使用方式,这使得配置神经网络变得更为简单,用户不需要再去了解复杂的后端科学计算库。

图 11:Keras 速查表

10 Numpy

Numpy 旨在作为 Python 的 CPython 参考实现,它是一个非优化的字节码解释器。针对这个 Python 版本编写的一些数学算法通常比相同代码的编译版本慢一些。

Numpy 通过提供多维数组和函数,以及在数组上的高效运算符来解决运算缓慢的问题,这需要需要重写一些代码,主要是使用 NumPy 的一些内循环。

图 12:Numpy 速查表

11 Pandas

"Pandas" 这个名称来源于术语 "面板数据", 这是多维结构化数据集的一个计量经济学术语。

图 13:Pandas 速查表

12 数据清洗

“数据清洗”正逐渐渗入流行文化。在 2017 年的电影《金刚:骷髅岛》中,由 Marc Evan Jackson 扮演的角色 Steve Woodward 就是一位数据清洗师。

图 14:数据清洗速查表

图 15:Pandas 数据清洗速查表

13 使用 dplyr 和 tidyr 进行数据清洗

图 16a:基于 dplyr 和 tidyr 的数据清洗速查表

图 16b:基于 dplyr 和 tidyr 的数据清洗速查表

14 Scipy

Scipy 是基于 Numpy 数组对象的一个科学计算库,它是 NumPy 全家桶(包括 Matplotlib、Pandas、SymPy 等工具包)的一部分,也是科学计算库的一个扩展集。

这个 Numpy 全家桶与其他应用程序(如 MATLAB、GNU Octave 和 Scilab)有很多共同的用户。NumPy 全家桶有时也被称为 SciPy 全家桶。

图 17:Scipy 速查表

15 Matplotlib

Matplotlib 是一个面向 Python 编程语言及其数学计算库 NumPy 的绘图工具库。Matplotlib 提供了面向对象的 API,它使用通用的 GUI 工具包(例如 Tkinter、wxPython、Qt 或者 GTK+)。

虽然也有基于状态机的程序接口“pylab“(像 OpenGL),其设计与 MATLAB 非常相似,但是大家却不提倡使用它。SciPy 使用了 matplotlib。

pyplot 是 matplotlib 中的一个模块,提供类似 MATLAB 的接口。按照设计,Matplotlib 可以跟 MATLAB 一样使用,你可以在 Python 中使用它,并且是免费的。

图 18:Matplotlib 速查表

16 数据可视化

图 19:数据可视化速查表

图 20:ggplot 速查表

17 PySpark

图 21:Pyspark 速查表

18 Big-O(时间复杂度)

图 22:Big-O 算法速查表

图 23:Big-O 算法复杂度表

图 24:不同数据结构实现算法的时间复杂度

图 25:不同的数组排序算法时间复杂度

关于作者:Stefan 是 Chatbot's Life 的创始人,这是一家聊天机器人媒体和咨询公司。到目前为止,Chatbot's Life 每月的浏览量超过了 150k,成了在线学习 Bots&AI 的优质资源。同时,Chatbot's Life 还为多家顶级机器人企业提供咨询工作,例如 Swelly、Instavest、OutBrain 和 NearGrop。

原文:https://becominghuman.ai/cheat-sheets-for-ai-neural-networks-machine-learning-deep-learning-big-data-678c51b4b463

这可能是AI、机器学习和大数据领域覆盖最全的一份速查表的更多相关文章

  1. 分享 - 27 个机器学习、数学、Python 速查表

      转载自:伯乐在线 - iPytLab,原文链接,侵删 机器学习涉及到的方面非常多.当我开始准备复习这些内容的时候,我找到了许多不同的”速查表”, 这些速查表针对某一主题都罗列出了所有我需要知道的知 ...

  2. Kona JDK 在腾讯大数据领域内的实践与发展

    导语 | 近日,云+社区技术沙龙“腾讯开源技术”圆满落幕.本次沙龙邀请了多位腾讯技术专家,深度揭秘了腾讯开源项目TencentOS tiny.TubeMQ.Kona JDK.TARS以及Medical ...

  3. Github标星3K+,热榜第三,一网打尽数据科学速查表

    这几天,Github上的趋势榜一天一换. 这次一个名为 Data-Science--Cheat-Sheet 的项目突然蹿到了第三名. 仔细一看,确实干货满满.来,让文摘菌推荐一下~ 这个项目本质上是备 ...

  4. 机器学习速查表(cheatsheet)资源汇总分享

    本文收集整理了机器学习相关速查表(Machine Learning Cheatsheet),包含机器学习.Python.Numpy.Pandas.Matplotlib.线性代数.微积分.统计学.概率论 ...

  5. python 下的数据结构与算法---2:大O符号与常用算法和数据结构的复杂度速查表

    目录: 一:大O记法 二:各函数高阶比较 三:常用算法和数据结构的复杂度速查表 四:常见的logn是怎么来的 一:大O记法 算法复杂度记法有很多种,其中最常用的就是Big O notation(大O记 ...

  6. 可能是史上最全的机器学习和Python(包括数学)速查表

    新手学习机器学习很难,就是收集资料也很费劲.所幸Robbie Allen从不同来源收集了目前最全的有关机器学习.Python和相关数学知识的速查表大全.强烈建议收藏! 机器学习有很多方面. 当我开始刷 ...

  7. 机器学习算法 Python&R 速查表

    sklearn实战-乳腺癌细胞数据挖掘( 博主亲自录制) https://study.163.com/course/introduction.htm?courseId=1005269003&u ...

  8. 大数据领域两大最主流集群管理工具Ambari和Cloudera Manger

    不多说,直接上干货! 目前啊,都知道,大数据集群管理方式分为手工方式(Apache hadoop)和工具方式(Ambari + hdp 和Cloudera Manger + CDH).  手工部署呢, ...

  9. 大数据开发-Flink-窗口全解析

    Flink窗口背景 Flink认为Batch是Streaming的一个特例,因此Flink底层引擎是一个流式引擎,在上面实现了流处理和批处理.而Window就是从Streaming到Batch的桥梁. ...

随机推荐

  1. 字符串循环右移N位

    给一个长度为n的字符串,把这个字符串循环右移N位(0<N<n),要求只用O(1)的额外空间和O(N)时间,有些什么方法 一开始想到的是先保存temp=s[0],在左起第N个移到s[0]的位 ...

  2. unity动画状态机的学习

    简单贴一下步骤,备忘 添加多个动画到动画控制器 创建transition,添加转换条件 在代码里面获取animator组件,然后animator.setXXX即可

  3. mysql-12序列使用

    mysql序列是一组整数:1,2,3....,由于一张数据表只能有一个字段自增主键,如果你想实现其他字段自动增加,就可以使用mysql序列来实现. 使用auto_increment来定义列 drop ...

  4. Waiting for device dev/disk/by-id/ata-...-part2 to appear

    问题: 平台:Oralce VM Virtualbox的虚拟机Opensuse11.4 导出该机器的OVA文件后,把该OVA文件导入虚拟机,开机启动时报如下错误: Trying manual resu ...

  5. 大白话系列之C#委托与事件讲解(序言)

    声明:本系列非原创,因为太精彩才转载,如有侵权请通知删除,原文:http://www.cnblogs.com/wudiwushen/archive/2010/04/20/1698795.html 在讲 ...

  6. Oracle 11g 新特性 -- Oracle Restart 说明(转载)

    转载:http://blog.csdn.net/tianlesoftware/article/details/8435670 一.  OHASD 说明 Oracle 的Restart 特性是Oracl ...

  7. oracle9i-11.2安装包及补丁包下载链接

    ORACLE 9i Oracle9i Database Release 2 Enterprise/Standard/Personal Edition for Windows NT/2000/XPhtt ...

  8. Maven(九)”编码 gbk 的不可映射字符“ 问题解决方案

    解决这个问题的思路: 在maven的编译插件中声明正确的字符集编码编码——编译使用的字符集编码与代码文件使用的字符集编码一致!! 安装系统之后,一般中文系统默认字符集是GBK.我们安装的软件一般都继承 ...

  9. AUC,KS,ROC

    要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的.其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已.拿逻辑回归举例,模型训练完成之后每个样本都会得 ...

  10. IrisBlur - 虹膜模糊

    [IrisBlur - 虹膜模糊] IrisBlur模拟人眼的虹膜,本质上是一个控制程度更高的FieldBlur,在FieldBlur的基础上暴露了更多的参数. Choose Filter >  ...