GitHub NLP项目:自然语言处理项目的相关干货整理

自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为自然语言处理NLP初学者整理了一份庞大的自然语言处理项目领域的概览,包括了很多人工智能应用程序。选取的参考文献与资料都侧重于最新的深度学习研究成果。这些自然语言处理项目资源能为想要深入钻研一个自然语言处理NLP任务的人们提供一个良好的开端。

自然语言处理项目的相关干货整理:

指代消解

https://github.com/Kyubyong/nlp_tasks#coreference-resolution

论文自动评分

自动语音识别

自动摘要

共指消解

语法错误校正

字素转换到音素

语种识别

语言建模

词形还原

唇语辨别

机器翻译

命名实体识别

释义检测

语法分析

词性标记

拼音与中文转换

问答系统

关系提取

语义角色标记

语句边界消歧

情绪分析

源分离

说话者识别

语音分段

语音合成

语音增强

词干提取

术语提取

文本简化

文本蕴涵

音译

词嵌入

词汇预测

词分割

词义消歧

有趣的项目

karpathy/char-rnn · GitHub :一个基于RNN的文本生成器。可以自动生成莎士比亚的剧本或者shell代码。 
https://github.com/karpathy/char-rnn

phunterlau/wangfeng-rnn · GitHub : 基于char-rnn的汪峰歌词生成器 
https://github.com/phunterlau/wangfeng-rnn

google/deepdream · GitHub :画出神经网络眼中的世界 
https://github.com/google/deepdream

facebook/MemNN · GitHub :memnn的一个官方实现。可以回答诸如“小明在操场;小王在办公室;小明捡起了足球;小王走进了厨房。问:小王在去厨房前在哪里?”,这样涉及推理和理解的问题。 
https://github.com/facebook/MemNN

skaae/lasagne-draw · GitHub :用RNN生成手写数字。 
https://github.com/skaae/lasagne-draw

keras/addition_rnn.py at master · fchollet/keras · GitHub :用RNN自动学会加法规则。 
https://github.com/keras-team/keras/blob/master/examples/addition_rnn.py

karpathy/neuraltalk · GitHub :自动根据图像生成文本描述。 
https://github.com/karpathy/neuraltalk

ryankiros/neural-storyteller · GitHub: 看图讲故事 
https://github.com/ryankiros/neural-storyteller

karpathy/neuraltalk2 · GitHub:看图生成标注 
https://github.com/karpathy/neuraltalk2

jcjohnson/neural-style · GitHub:将照片变成大师风格的绘画 
https://github.com/jcjohnson/neural-style

Newmu/dcgan_code · GitHub: 卷积生成式对抗网络,生成图像 
https://github.com/Newmu/dcgan_code

nagadomi/waifu2x · GitHub:CNN来放大动漫图片 
https://github.com/nagadomi/waifu2x

去年我在Neuraltalk2 的基础上做了个视频字幕自动生成的实验, 现在把代码公布在Github上: 
GitHub - cgq5/Video-Caption-with-Neuraltalk2: Code release of captioning videos using Neuraltalk2. 
https://github.com/cgq5/Video-Caption-with-Neuraltalk2

生成结果在这里:https://www.youtube.com/watch?v=FmSsek5luHk

NLP项目的更多相关文章

  1. 词义消除歧义NLP项目实验

    词义消除歧义NLP项目实验 本项目主要使用https://github.com/alvations/pywsd 中的pywsd库来实现词义消除歧义 目前,该库一部分已经移植到了nltk中,为了获得更好 ...

  2. 优质中文NLP资源集合,做项目一定用得到!

    今天要给大家在推荐 Github 上一个优质的中文 NLP 工具和资源集合项目——funNLP,已经获得了 5.3k Stars,1k+ Forks. 项目作者 杨洋,一枚水博&互联网民工,目 ...

  3. NLP中的用N-gram语言模型做英语完型填空的环境搭建

    本文是对xing_NLP中的用N-gram语言模型做完型填空这样一个NLP项目环境搭建的一个说明,本来想写在README.md中.第一次用github中的wiki,想想尝试一下也不错,然而格式非常的混 ...

  4. NLP相关问题中文本数据特征表达初探

    1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发 ...

  5. NLP入门(一)词袋模型及句子相似度

      本文作为笔者NLP入门系列文章第一篇,以后我们就要步入NLP时代.   本文将会介绍NLP中常见的词袋模型(Bag of Words)以及如何利用词袋模型来计算句子间的相似度(余弦相似度,cosi ...

  6. NLP领域的ImageNet时代到来:词嵌入「已死」,语言模型当立

    http://3g.163.com/all/article/DM995J240511AQHO.html 选自the Gradient 作者:Sebastian Ruder 机器之心编译 计算机视觉领域 ...

  7. 最新自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict

    http://blog.csdn.net/jdbc/article/details/53292414 过去半年以来,自然语言处理领域进化出了一件神器.此神器乃是深度神经网络的一种新模式,该模式分为:e ...

  8. NLP问题特征表达基础 - 语言模型(Language Model)发展演化历程讨论

    1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发 ...

  9. 自然语言处理(NLP) - 数学基础(1) - 总述

    正如我在<2019年总结>里说提到的, 我将开始一系列自然语言处理(NLP)的笔记. 很多人都说, AI并不难啊, 调现有库和云的API就可以啦. 然而实际上并不是这样的. 首先, AI这 ...

随机推荐

  1. Django之cookie、session

    会话跟踪技术 可以把会话理解为客户端与服务器之间的一次会晤,在一次会晤中可能会包含多次请求和响应. 一次会话过程中,我们应该注意的是什么呢? 那就是,一些操作要保证用户操作的是用户自己个人的数据.举个 ...

  2. BZOJ 4369: [IOI2015]teams分组

    把一个人看成二维平面上的一个点,把一个K[i]看成左上角为(0,+max),右下角为(K[i],K[i])的一个矩阵,那么可以很好地描述人对于询问是否合法(我也不知道他怎么想到这东西的) 然后把一组询 ...

  3. dedecms 建站相关问题

    1.栏目新建文章提示:模板文件不存在,无法解析文档! 解决方法:把模板文件使用".html"的格式 /include/arc.archives.class.php 556行 if ...

  4. mongodb系统出错。 发生系统错误 1067。 进程意外终止。

    MongoDB安装目录\data\将此文件夹下的mongod.lock删除 mongod.exe --config E:\ruanjian\MongoDB\mongod.cfg --remove mo ...

  5. LiveScript 函数

    The LiveScript Book     The LiveScript Book 函数 定义函数是非常轻量级的. 1.(x, y) -> x + y2.3.-> # an empty ...

  6. jQuery 样式操作、文档操作、属性操作的方法总结

    文档操作: addClass()             向匹配的元素添加指定的类名.after()                    在匹配的元素之后插入内容.append()         ...

  7. spring AOP详解三

    CGLib采用非常底层的字节码技术,可以为一个类创建子类,并在子类中采用方法拦截的结束拦截所有父类方法的调用,并顺势织入横切逻辑.我们采用CGLib技术可以编写一个可以为任何类创建织入横切逻辑代理对象 ...

  8. C遇到的编译错误整理

    1: Permission denied collect2.exe: error: ld returned exit status c:/mingw/bin/../lib/gcc/mingw32/6. ...

  9. 【bzoj4785】[Zjoi2017]树状数组 线段树套线段树

    题目描述 漆黑的晚上,九条可怜躺在床上辗转反侧.难以入眠的她想起了若干年前她的一次悲惨的OI 比赛经历.那是一道基础的树状数组题.给出一个长度为 n 的数组 A,初始值都为 0,接下来进行 m 次操作 ...

  10. BZOJ 3729 Gty的游戏 ——Splay

    很久很久之前,看到Treap,好深啊 很久之前看到Splay,这数据结构太神了. 之后学习了LCT. 然后看到Top-Tree就更觉得神奇了. 知道我见到了这题, 万物基于Splay 显然需要维护子树 ...