SciTech-Mathmatics-ProbabilitiesAndStatistics-Distribution-is-all-you-need: 概率统计到深度学习
Distribution-is-all-you-need
概率统计到深度学习,四大技术路线图谱,都在这里!
https://github.com/graykode/distribution-is-all-you-need
自然语言处理路线图: 数学基础 -> 语言基础 -> 模型和算法
项目作者:Tae-Hwan Jung, Github:graykode,
2019-09-30 13:35, 选自Github
自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法。
相比图像或语音,文本的变化更加复杂。
例如从预处理来看,NLP 就要求我们根据对数据的理解定制一种流程。
而且相比图像等更偏向感知的智能,自然语言包含更高一级的智能能力,
不论是承载思想、情感还是推理。
那么要怎样学习NLP自然语言处理,有什么比较好的路线吗?
通常而言,在数学和机器学习的基础上,
我们还需要了解自然语言的规则与现象,
这样才能进一步探讨该怎样处理自然语言。
本文介绍刚刚发布的一个开源项目,
韩国庆熙大学本科生 Tae-Hwan Jung 总结的一套 NLP 的技术路线图。
值得注意的是,Tae-Hwan Jung 此前已经开源了很多优秀的项目,
包括 4.3k+ star 量的 NLP 教程。
项目地址:https://github.com/graykode/nlp-roadmap
Tae-Hwan Jung 表示,本项目面向对 NLP 感兴趣的学生,
该路线图提供了学习 NLP 的思维导图及关键词信息,
它覆盖了从概率/统计到 SOTA NLP 模型的素材。

如上所示为 NLP 的技术基石,最基础的当然还是数学和算法方面的知识,此外语言学和机器学习知识也必不可少。再往上主要是文本挖掘与 NLP,在作者看来,前者更偏向于常规的算法与浅层机器学习模型,后者更偏向于深度学习模型。
四大技术线路图
如下从概率和统计到深度学习方法展示了四大技术路线图,它们从基石到高层展示了完整的知识领域。
概率与统计

机器学习

文本挖掘

自然语言处理

关键词之间的关系可能解释得比较模糊,因为是以语义思维导图的方式表示的。
读者们只需要看方框内的关键词就行,把它们当作必学部分;
一张图容纳如此多的关键词和知识点; 因此,请切记该路线图只是一种思路或者建议;
SciTech-Mathmatics-ProbabilitiesAndStatistics-Distribution-is-all-you-need: 概率统计到深度学习的更多相关文章
- 本人AI知识体系导航 - AI menu
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯 徐亦达老板 Dirichlet Process 学习 ...
- Spark2.0机器学习系列之1: 聚类算法(LDA)
在Spark2.0版本中(不是基于RDD API的MLlib),共有四种聚类方法: (1)K-means (2)Latent Dirichlet allocation (LDA) ...
- 全网最详细的用pip安装****模块报错:Could not find a version that satisfies the requirement ****(from version:) No matching distribution found for ****的解决办法(图文详解)
不多说,直接上干货! 问题详情 这个问题,很普遍.如我这里想实现,Windows下Anaconda2 / Anaconda3里正确下载安装用来向微信好友发送消息的itchat库. 见,我撰写的 全网最 ...
- Could not find a version that satisfies.... No matching distribution found for .....
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/10227403.html 今天在安装mysql-python的时候报了很多的错误,其中一条就是这 ...
- Uniform Distribution均匀分布
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&am ...
- Gumbel distribution
目录 概 主要内容 定义 Gumbel-Max trick Gumbel trick 用于归一化 代码 概 感觉这个分布的含义很有用啊, 能预测'最大', 也就是自然灾害, 太牛了. 主要内容 定义 ...
- 【Machine Learning】Python开发工具:Anaconda+Sublime
Python开发工具:Anaconda+Sublime 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现 ...
- NLP点滴——文本相似度
[TOC] 前言 在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,我们都知道文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性.而有了文本之间相似性的度 ...
- 【热文】 为什么很多硅谷工程师偏爱 OS X,而不是 Linux 或 Windows?
校对:伯乐在线 - 黄利民 链接: 1. Why do most of the developers in Silicon Valley prefer OS X over Linux or Windo ...
- NLP&数据挖掘基础知识
Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Er ...
随机推荐
- tar命令打包指定目录及其文件,而不包括其上级目录
想指定将/var目录下的log目录及其文件打包到当前目录,在压缩包解压时不包括/var目录,可使用如下方式: tar -zcvf log_bak.tar.gz -C /var/ log # 注意log ...
- Java Objects.equals(a,b)的说明
一:值是null的情况: a.equals(b), a 是null, 抛出NullPointException异常. a.equals(b), a不是null, b是null, 返回false Obj ...
- 点赞背后的技术大冒险:分布式事务与SAGA模式
title: 点赞背后的技术大冒险:分布式事务与SAGA模式 date: 2025/05/07 00:12:40 updated: 2025/05/07 00:12:40 author: cmdrag ...
- Axure RP仿抖音短视频APP交互原型图模板
Axure RP仿抖音短视频APP高保真交互原型模板,原型图设计灵感来自于抖音段视频APP,在预览里你可以看到抖音的影子.本素材包含登录.首页推荐.同城.直播间.消息.朋友.发布.我的.搜索等主要模块 ...
- Linux 常识和操作(常用命令)
1. 存放用户账号的文件在哪里? /etc/passwd 2. 如何删除一个非空的目录? rm -rf 目录名 3. 查看当前的工作目录用什么命令? pwd 4. 创建一个文件夹用什么命令? mkdi ...
- Python基础 - 多线程(下)
上篇对多线程有一个初步的认识, 常用的要点, 也是对照这 多进程 来试验的. 目的呢, 还是再不断地提醒自己能通俗理解进程和线程的"关系", OS -> 多进程 -> ...
- 那些年的鸡汤&&毒鸡汤
既然一定有人会赢,那凭什么不能是我? 既然我想赢得更漂亮,为什么不竭尽全力? 既然是竭尽全力,为什么还要找任何借口来拖延,为什么不在此刻就开始? 一时兴起的踌躇满志没什么了不起,每天都在坚持着进步才是 ...
- 使用IntelliJ IDEA 比对文件内容差异
摘要:使用IntelliJ IDEA 比对文件内容差异部分,迅速定位修改点. 在敲代码的过程中,经常需要比较两个代码文件的内容差异,很多人会去网上找文件比较工具来处理,其实 IntelliJ ID ...
- Spring Boot 整合ActiveMQ实现延时发现消息
生产者提供两个发送消息的方法,一个是即时发送消息,一个是延时发送消息.延时发送消息需要手动修改activemq目录conf下的activemq.xml配置文件,开启延时.本文中maven依赖文件和ap ...
- 流批一体开源项目ChunJun技术公开课——ChunJun同步Hive事务表
一键直达直播间 一.直播介绍 上两期渡劫同学为大家分享了ChunJun数据还原的DDL模块,想必大家对这一模块有了比较深入的了解,本期无倦同学将会为大家分享ChunJun同步Hive事务表的相关内容, ...