如何少走弯路安装NLTK?
NLP中分词是一件麻烦事,nltk可以一定程度上优雅的解决一些需求
如果你去搜索“nltk安装”,那么多半会得到以下的代码
import nltk
nltk.download()
你多半不会进入如下界面(因为网络问题会提示远程连接失败)

然后你什么都没下载就试图去使用nltk,会报错如下:
LookupError:
**********************************************************************
  Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:
  >>> import nltk
  >>> nltk.download('punkt')
  For more information see: https://www.nltk.org/data.html
  Attempted to load tokenizers/punkt/english.pickle
  Searched in:
    - 'C:\\Users\\Administrator/nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\share\\nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\lib\\nltk_data'
    - 'C:\\Users\\Administrator\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - ''
**********************************************************************
正确的安装方法
去GitHub下载所需模块
NLTK项目地址:
https://github.com/nltk/nltk_data/tree/gh-pages/packages
在如下路径找到punkt.zip

还记得刚刚的报错吗?
 Searched in:
    - 'C:\\Users\\Administrator/nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\share\\nltk_data'
    - 'C:\\Users\\Administrator\\Desktop\\venv\\lib\\nltk_data'
    - 'C:\\Users\\Administrator\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - ''
在以下任意路径中,建立tokenizers文件夹,把刚刚下载的punkt.zip解压到此处
此时(以'C:\ nltk_data'为例),punkt.zip的解压路径应该为:
C:\ nltk_data\tokenizers\punkt
测试
import nltk
yuliao = 'hello, how are you?'
res = nltk.word_tokenize(yuliao)
print(res)
如何少走弯路安装NLTK?的更多相关文章
- PHP程序员从小白到高手,掌握这些技能少走弯路
		PHP程序员从小白到高手,掌握这些技能少走弯路 PHP究竟是不是最好的语言,一直以来是程序员最大的“争议”,但毋庸置疑的是,PHP绝对是最有前途和力量的变成语言,也是你入门最值得学习的语言. 作为老牌 ... 
- win安装NLTK出现的问题
		一.今天学习Python自然语言处理(NLP processing) 需要安装自然语言工具包NLTK Natural Language Toolkit 按照教程在官网https://pypi.pyth ... 
- 离线下载安装 NLTK 的 nltk_data 模块
		离线下载安装 NLTK 的 nltk_data 模块 转 https://blog.csdn.net/u010167269/article/details/63684137 在 Linux 上使用 N ... 
- ubuntu14上安装nltk
		安装nltk 1)在buntu终端命令键入:wget https://bootstrap.pypa.io/ez_setup.py,下载ez_setup.py. 2)下载完成后后,键入:sudo py ... 
- 在ubuntu16.04+python3.5情况下安装nltk,以及gensim时pip3安装不成功的解决办法
		在ubuntu16.04+python3.5情况下安装nltk,以及gensim时pip3安装不成功的解决办法,我刚开始因为不太会用linux命令,所以一直依赖于python 的pip命令,可是怎么都 ... 
- 安装NLTK
		在网上找了一圈,没找到几个靠谱的安装流程,在http://nltk.org/install.html上找到各平台下安装流程: Windows平台: 以下操作假定你的机器上还没有安装Python,如果你 ... 
- 手机酷派4G5316 5313s 黑砖 求转成功   9008端口           9006端口   少走弯路选对镜像
		首先要有资料 里面有教程 http://pan.baidu.com/s/1bpjxP6n 1.用其他手机 or u 盘往sd卡放进“强制进入下载模式的文件” 2. 驱动 3.刷机工具 下载镜像 ... 
- C语言超全学习路线(收藏让你少走弯路)
		刚入门是否觉得C语言很难?那可能是你还没找到正确的C语言学习路线,收藏以防找不到,让你少走弯路. 基本语法 选择控制语句 if,swith 循环控制语句 while,for 控制语句相关关键字分析 变 ... 
- 让你少走弯路的搭建树莓派的Net与NodeJS运行环境
		树莓派是当前最火的嵌入计算平台没有之一,树莓派可以给我们无数的想象,树莓派的高性能.低功耗.低成本.可扩展性(最新的树莓派原生支持WIFI和蓝牙,这功能太赞了)深受大家的喜爱.虽然树莓派到目前为止 ... 
随机推荐
- 微服务架构(Microservices) ——Martin Flower
			不知不觉到达了Sring Boot的学习中了,在学习之前,了解微服务架构是很有必要的,对于自己提升今后面试的软实力有很大帮助,在此写下. 让我们接下来看下Martin Flower 如何解释微服务架构 ... 
- openresty - nginx - 配置
			local function local_print(str) local dbg = io.open("conf/lua/logs/output.txt", "a+&q ... 
- 太方便了!利用Python对批量Pdf转Word
			在wps或者office里面可以将pdf转word,不过只能免费转前面5页,超过5页就需要会员.今天教大家一个Python办公小技巧:批量Pdf转Word ,这样可以自由想转多少页都可以. 思路:这里 ... 
- OFRecord 图片文件制数据集
			OFRecord 图片文件制数据集 在 OFRecord 数据格式 和 加载与准备 OFRecord 数据集 中,分别学习了 OFRecord 数据格式,以及如何将其它数据集转为 OFRecord 数 ... 
- 将DataTable转成Json字符串
			1 public string ToJson(DataTable tbl) 2 { 3 if (tbl.Rows.Count > 0) 4 { 5 DataRowCollection rows ... 
- 重新整理 .net core 实践篇—————日志系统之结构化[十八]
			前言 什么是结构化呢? 结构化,就是将原本没有规律的东西进行有规律话. 就比如我们学习数据结构,需要学习排序然后又要学习查询,说白了这就是一套,没有排序,谈如何查询是没有意义的,因为查询算法就是根据某 ... 
- 这 7 个 Linux 命令,你是怎么来使用的?
			使用 Linux 系统的开发者,很多人都有自己喜欢的系统命令,下面这个几个命令令是我平常用的比较多的,分享一下. 我不会教科书般的罗列每个指令的详细用法,只是把日常开发过程中的一些场景下,经常使用的命 ... 
- csps前小结
			冒着题没改完颓废被发现的风险来写博客 好像离csps只剩两天了,然而没啥感觉 最近考试有时考得还算可以,有时也会很炸 今天考试事实上心态啥崩,因为T1结论题一直没思路,想了一个小时连暴力都没打 过了一 ... 
- 【题解】Luogu2915 [USACO08NOV]奶牛混合起来Mixed Up Cows
			题目描述 Each of Farmer John's N (4 <= N <= 16) cows has a unique serial number S_i (1 <= S_i & ... 
- 使用A Star 算法实现自动寻路详解
			@ 目录 1.什么是A Start算法 2.A Star算法的原理和流程 2.1 前提 2.1.1 从起点开始扩散的节点 2.1.2 最短距离计算公式:F = G + H 2.1.3 欧几里得距离计算 ... 
