Distribution-is-all-you-need

概率统计到深度学习,四大技术路线图谱,都在这里!

https://github.com/graykode/distribution-is-all-you-need

自然语言处理路线图: 数学基础 -> 语言基础 -> 模型和算法

项目作者:Tae-Hwan Jung, Github:graykode,

2019-09-30 13:35, 选自Github

自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法。

相比图像或语音,文本的变化更加复杂。

例如从预处理来看,NLP 就要求我们根据对数据的理解定制一种流程。

而且相比图像等更偏向感知的智能,自然语言包含更高一级的智能能力,

不论是承载思想、情感还是推理。

那么要怎样学习NLP自然语言处理,有什么比较好的路线吗?

通常而言,在数学和机器学习的基础上,

我们还需要了解自然语言的规则与现象,

这样才能进一步探讨该怎样处理自然语言。

本文介绍刚刚发布的一个开源项目,

韩国庆熙大学本科生 Tae-Hwan Jung 总结的一套 NLP 的技术路线图。

值得注意的是,Tae-Hwan Jung 此前已经开源了很多优秀的项目,

包括 4.3k+ star 量的 NLP 教程。

项目地址:https://github.com/graykode/nlp-roadmap

Tae-Hwan Jung 表示,本项目面向对 NLP 感兴趣的学生,

该路线图提供了学习 NLP 的思维导图及关键词信息,

它覆盖了从概率/统计到 SOTA NLP 模型的素材。



如上所示为 NLP 的技术基石,最基础的当然还是数学和算法方面的知识,此外语言学和机器学习知识也必不可少。再往上主要是文本挖掘与 NLP,在作者看来,前者更偏向于常规的算法与浅层机器学习模型,后者更偏向于深度学习模型。

四大技术线路图

如下从概率和统计到深度学习方法展示了四大技术路线图,它们从基石到高层展示了完整的知识领域。

概率与统计

机器学习

文本挖掘

自然语言处理

关键词之间的关系可能解释得比较模糊,因为是以语义思维导图的方式表示的。

读者们只需要看方框内的关键词就行,把它们当作必学部分;

一张图容纳如此多的关键词和知识点; 因此,请切记该路线图只是一种思路或者建议;

SciTech-Mathmatics-ProbabilitiesAndStatistics-Distribution-is-all-you-need: 概率统计到深度学习的更多相关文章

  1. 本人AI知识体系导航 - AI menu

    Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯   徐亦达老板 Dirichlet Process 学习 ...

  2. Spark2.0机器学习系列之1: 聚类算法(LDA)

    在Spark2.0版本中(不是基于RDD API的MLlib),共有四种聚类方法:      (1)K-means      (2)Latent Dirichlet allocation (LDA)  ...

  3. 全网最详细的用pip安装****模块报错:Could not find a version that satisfies the requirement ****(from version:) No matching distribution found for ****的解决办法(图文详解)

    不多说,直接上干货! 问题详情 这个问题,很普遍.如我这里想实现,Windows下Anaconda2 / Anaconda3里正确下载安装用来向微信好友发送消息的itchat库. 见,我撰写的 全网最 ...

  4. Could not find a version that satisfies.... No matching distribution found for .....

    原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/10227403.html 今天在安装mysql-python的时候报了很多的错误,其中一条就是这 ...

  5. Uniform Distribution均匀分布

    sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&am ...

  6. Gumbel distribution

    目录 概 主要内容 定义 Gumbel-Max trick Gumbel trick 用于归一化 代码 概 感觉这个分布的含义很有用啊, 能预测'最大', 也就是自然灾害, 太牛了. 主要内容 定义 ...

  7. 【Machine Learning】Python开发工具:Anaconda+Sublime

    Python开发工具:Anaconda+Sublime 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现 ...

  8. NLP点滴——文本相似度

    [TOC] 前言 在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,我们都知道文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性.而有了文本之间相似性的度 ...

  9. 【热文】 为什么很多硅谷工程师偏爱 OS X,而不是 Linux 或 Windows?

    校对:伯乐在线 - 黄利民 链接: 1. Why do most of the developers in Silicon Valley prefer OS X over Linux or Windo ...

  10. NLP&数据挖掘基础知识

    Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Er ...

随机推荐

  1. tar命令打包指定目录及其文件,而不包括其上级目录

    想指定将/var目录下的log目录及其文件打包到当前目录,在压缩包解压时不包括/var目录,可使用如下方式: tar -zcvf log_bak.tar.gz -C /var/ log # 注意log ...

  2. Java Objects.equals(a,b)的说明

    一:值是null的情况: a.equals(b), a 是null, 抛出NullPointException异常. a.equals(b), a不是null, b是null, 返回false Obj ...

  3. 点赞背后的技术大冒险:分布式事务与SAGA模式

    title: 点赞背后的技术大冒险:分布式事务与SAGA模式 date: 2025/05/07 00:12:40 updated: 2025/05/07 00:12:40 author: cmdrag ...

  4. Axure RP仿抖音短视频APP交互原型图模板

    Axure RP仿抖音短视频APP高保真交互原型模板,原型图设计灵感来自于抖音段视频APP,在预览里你可以看到抖音的影子.本素材包含登录.首页推荐.同城.直播间.消息.朋友.发布.我的.搜索等主要模块 ...

  5. Linux 常识和操作(常用命令)

    1. 存放用户账号的文件在哪里? /etc/passwd 2. 如何删除一个非空的目录? rm -rf 目录名 3. 查看当前的工作目录用什么命令? pwd 4. 创建一个文件夹用什么命令? mkdi ...

  6. Python基础 - 多线程(下)

    上篇对多线程有一个初步的认识, 常用的要点, 也是对照这 多进程 来试验的. 目的呢, 还是再不断地提醒自己能通俗理解进程和线程的"关系", OS -> 多进程 -> ...

  7. 那些年的鸡汤&&毒鸡汤

    既然一定有人会赢,那凭什么不能是我? 既然我想赢得更漂亮,为什么不竭尽全力? 既然是竭尽全力,为什么还要找任何借口来拖延,为什么不在此刻就开始? 一时兴起的踌躇满志没什么了不起,每天都在坚持着进步才是 ...

  8. 使用IntelliJ IDEA 比对文件内容差异

    摘要:使用IntelliJ IDEA 比对文件内容差异部分,迅速定位修改点.   在敲代码的过程中,经常需要比较两个代码文件的内容差异,很多人会去网上找文件比较工具来处理,其实 IntelliJ ID ...

  9. Spring Boot 整合ActiveMQ实现延时发现消息

    生产者提供两个发送消息的方法,一个是即时发送消息,一个是延时发送消息.延时发送消息需要手动修改activemq目录conf下的activemq.xml配置文件,开启延时.本文中maven依赖文件和ap ...

  10. 流批一体开源项目ChunJun技术公开课——ChunJun同步Hive事务表

    一键直达直播间 一.直播介绍 上两期渡劫同学为大家分享了ChunJun数据还原的DDL模块,想必大家对这一模块有了比较深入的了解,本期无倦同学将会为大家分享ChunJun同步Hive事务表的相关内容, ...