GitHub NLP项目:自然语言处理项目的相关干货整理

自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为自然语言处理NLP初学者整理了一份庞大的自然语言处理项目领域的概览,包括了很多人工智能应用程序。选取的参考文献与资料都侧重于最新的深度学习研究成果。这些自然语言处理项目资源能为想要深入钻研一个自然语言处理NLP任务的人们提供一个良好的开端。

自然语言处理项目的相关干货整理:

指代消解

https://github.com/Kyubyong/nlp_tasks#coreference-resolution

论文自动评分

自动语音识别

自动摘要

共指消解

语法错误校正

字素转换到音素

语种识别

语言建模

词形还原

唇语辨别

机器翻译

命名实体识别

释义检测

语法分析

词性标记

拼音与中文转换

问答系统

关系提取

语义角色标记

语句边界消歧

情绪分析

源分离

说话者识别

语音分段

语音合成

语音增强

词干提取

术语提取

文本简化

文本蕴涵

音译

词嵌入

词汇预测

词分割

词义消歧

有趣的项目

karpathy/char-rnn · GitHub :一个基于RNN的文本生成器。可以自动生成莎士比亚的剧本或者shell代码。 
https://github.com/karpathy/char-rnn

phunterlau/wangfeng-rnn · GitHub : 基于char-rnn的汪峰歌词生成器 
https://github.com/phunterlau/wangfeng-rnn

google/deepdream · GitHub :画出神经网络眼中的世界 
https://github.com/google/deepdream

facebook/MemNN · GitHub :memnn的一个官方实现。可以回答诸如“小明在操场;小王在办公室;小明捡起了足球;小王走进了厨房。问:小王在去厨房前在哪里?”,这样涉及推理和理解的问题。 
https://github.com/facebook/MemNN

skaae/lasagne-draw · GitHub :用RNN生成手写数字。 
https://github.com/skaae/lasagne-draw

keras/addition_rnn.py at master · fchollet/keras · GitHub :用RNN自动学会加法规则。 
https://github.com/keras-team/keras/blob/master/examples/addition_rnn.py

karpathy/neuraltalk · GitHub :自动根据图像生成文本描述。 
https://github.com/karpathy/neuraltalk

ryankiros/neural-storyteller · GitHub: 看图讲故事 
https://github.com/ryankiros/neural-storyteller

karpathy/neuraltalk2 · GitHub:看图生成标注 
https://github.com/karpathy/neuraltalk2

jcjohnson/neural-style · GitHub:将照片变成大师风格的绘画 
https://github.com/jcjohnson/neural-style

Newmu/dcgan_code · GitHub: 卷积生成式对抗网络,生成图像 
https://github.com/Newmu/dcgan_code

nagadomi/waifu2x · GitHub:CNN来放大动漫图片 
https://github.com/nagadomi/waifu2x

去年我在Neuraltalk2 的基础上做了个视频字幕自动生成的实验, 现在把代码公布在Github上: 
GitHub - cgq5/Video-Caption-with-Neuraltalk2: Code release of captioning videos using Neuraltalk2. 
https://github.com/cgq5/Video-Caption-with-Neuraltalk2

生成结果在这里:https://www.youtube.com/watch?v=FmSsek5luHk

NLP项目的更多相关文章

  1. 词义消除歧义NLP项目实验

    词义消除歧义NLP项目实验 本项目主要使用https://github.com/alvations/pywsd 中的pywsd库来实现词义消除歧义 目前,该库一部分已经移植到了nltk中,为了获得更好 ...

  2. 优质中文NLP资源集合,做项目一定用得到!

    今天要给大家在推荐 Github 上一个优质的中文 NLP 工具和资源集合项目——funNLP,已经获得了 5.3k Stars,1k+ Forks. 项目作者 杨洋,一枚水博&互联网民工,目 ...

  3. NLP中的用N-gram语言模型做英语完型填空的环境搭建

    本文是对xing_NLP中的用N-gram语言模型做完型填空这样一个NLP项目环境搭建的一个说明,本来想写在README.md中.第一次用github中的wiki,想想尝试一下也不错,然而格式非常的混 ...

  4. NLP相关问题中文本数据特征表达初探

    1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发 ...

  5. NLP入门(一)词袋模型及句子相似度

      本文作为笔者NLP入门系列文章第一篇,以后我们就要步入NLP时代.   本文将会介绍NLP中常见的词袋模型(Bag of Words)以及如何利用词袋模型来计算句子间的相似度(余弦相似度,cosi ...

  6. NLP领域的ImageNet时代到来:词嵌入「已死」,语言模型当立

    http://3g.163.com/all/article/DM995J240511AQHO.html 选自the Gradient 作者:Sebastian Ruder 机器之心编译 计算机视觉领域 ...

  7. 最新自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict

    http://blog.csdn.net/jdbc/article/details/53292414 过去半年以来,自然语言处理领域进化出了一件神器.此神器乃是深度神经网络的一种新模式,该模式分为:e ...

  8. NLP问题特征表达基础 - 语言模型(Language Model)发展演化历程讨论

    1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发 ...

  9. 自然语言处理(NLP) - 数学基础(1) - 总述

    正如我在<2019年总结>里说提到的, 我将开始一系列自然语言处理(NLP)的笔记. 很多人都说, AI并不难啊, 调现有库和云的API就可以啦. 然而实际上并不是这样的. 首先, AI这 ...

随机推荐

  1. graph-SCC

    strongly connected component(SCC): 里面的任一对顶点都是互相可达的. 一个有向图,将每个SCC缩成一个点,那么这个图就变成了DAG(有向无环图). 原图进行DFS之后 ...

  2. 汇编语言 Part 2——寄存器

    处理器操作主要涉及处理数据.这些数据可以存储在内存中并从中访问.但是,读取数据并将其存储到内存中会减慢处理器的速度,因为它涉及将数据请求通过控制总线发送到内存存储单元并通过同一通道获取数据的复杂过程. ...

  3. Divisibility by 25 CodeForces - 988E

    You are given an integer nn from 11 to 10181018 without leading zeroes. In one move you can swap any ...

  4. CSS效果常见问题

    详细解答参见上篇博客 问题1.如何用 div 画一个 xxx box-shadow 无限投影 (堆叠成复杂图案) ::before ::after 问题2.如何产生不占空间的边框 1.box-shad ...

  5. luogu3390 【模板】矩阵快速幂

    #include <iostream> #include <cstdio> using namespace std; typedef long long ll; ll k; c ...

  6. Leetcode 475.供暖气

    供暖气 冬季已经来临. 你的任务是设计一个有固定加热半径的供暖器向所有房屋供暖. 现在,给出位于一条水平线上的房屋和供暖器的位置,找到可以覆盖所有房屋的最小加热半径. 所以,你的输入将会是房屋和供暖器 ...

  7. 2018省赛赛第一次训练题解和ac代码

    第一次就去拉了点思维很神奇的CF题目 2018省赛赛第一次训练 # Origin Title     A CodeForces 607A Chain Reaction     B CodeForces ...

  8. Git 应用问题(一) —— failed to push some refs to git

    今天在本地创建了一个新的 repository,想关联到 Github 上的时候出现问题,如下: Gerrard@LAPTOP-79570TK2 MINGW64 /g/github-workspace ...

  9. P1108 低价购买 (动态规划)

    题目链接 Solution 似乎就是个很简单的最长不上升子序列输出方案. 但是有一个很艹蛋的条件: 不同方案选择价格必须不同. 且其股票价格不保证不相同. \(f[i]\) 代表以第 \(i\) 天结 ...

  10. django获取前端有multiple属性的select的多选项

    author_list = request.POST.getlist('author_list') ###