备注:win7 64位系统,netbeans编程 基本代码框架参见我的另一篇文章:NLPIR分词功能 代码实现: package cwordseg; import java.io.UnsupportedEncodingException; // import utils.SystemParas; import com.sun.jna.Library; import com.sun.jna.Native; /** * * 功能:添加/删除用户自定义词汇/词典 * 最后更新时间:2016年3月15日…
package ICTCLAS.I3S.Test; import java.io.UnsupportedEncodingException; import ICTCLAS.I3S.AC.ICTCLAS50; public class Test_UserDic { /** * @param args * @throws UnsupportedEncodingException */ public static void main(String[] args) throws UnsupportedE…
今天第一次使用NLPIR汉语分词系统. 遇到的问题: 当点击时, 出现以下界面 看了博客https://blog.csdn.net/yuyanyanyanyanyu/article/details/52636269,我明白了这是由于NLPIR-ICTCLAS分词授权过期造成的. 解决方案: 下载许可证,然后放到Data文件夹即可. 许可证下载地址为: https://github.com/NLPIR-team/NLPIR/tree/master/License/license%20for%20a…
NLPIR工具 支持自定义词表: 可以离线使用: 下载地址:http://ictclas.nlpir.org/newsdownloads?DocId=389 在线演示:http://ictclas.nlpir.org/nlpir/ 自然语言处理与信息检索共享平台:(nlpir相关的一些软件.文档.论文.语料库等资源)http://www.nlpir.org/ 上边这个地址写的信息比较详细丰富,但是万事开头难,很多同学不知道怎么具体应该调用?下边我就把几个步骤简单介绍一下: Step1.下载 我下…
重点内容为:  jQuery验证控件jquery.validate.js使用说明+中文API[http://www.tuicool.com/articles/iABvI3] 简单教程可以参考[jQuery的validate插件使用整理(传智播客_王昭珽)] (一)需求介绍 管理员后台添加用户时,邮箱需要满足需求有 (1)不能为空,因为要支持用户使用邮箱登陆 (2)不恩重复,因为要用户使用邮箱登陆所有重复会让使用户登陆报错 (3)格式正确 (二)效果 (三)编码 (1)jsp页面 说明:f:tex…
一.首先创建一个新用户: sudo adduser hadoop 其次设置密码: sudo passwd hadoop 如果无法使用root密码,请输入如下命令: sudo passwd root 二.更改用户权限sudo, 更改/etc/sudosers文件 cd /etc sudo vim /etc/sudosers 添加 hadoop ALL=(ALL:ALL) ALL 三.删除用户 sudo userdel -r hadooop…
http://www.nlpir.org/ http://blog.csdn.net/zhyh1986/article/details/9167593…
本文针对的问题是 ICTCLAS2015 的多线程分词,为了实现多线程做了简单的JAVA封装.如果有需要可以自行进一步封装其它接口. 首先ICTCLAS2015的传送门(http://ictclas.nlpir.org/),其对中文分词做的比较透彻,而且有一定的可调式性.但是应用到实际开发中的话,多线程操作是必须的,因此有了本文的初衷. 可能有的小伙伴不太清楚ICTCLASS是干嘛的,下面是一段介绍:NLPIR汉语分词系统(又名ICTCLAS2015),主要功能包括中文分词:词性标注:命名实体识…
目标 查看jieba分词组件源码,分析源码各个模块的功能,找到分词模块,实现能自定义分词字典,且优先级大于系统自带的字典等级,以医疗词语邻域词语为例. jieba分词地址:github地址:https://github.com/fxsjy/jieba jieba四种分词模式 精确模式,试图将句子最精确地切开,适合文本分析. 按照优先级只显示一次需要划分的词语. 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义. 比如清华大学,会划词显示 清华/ 清华大学/ 华大/…
一.普通java项目 (1)添加项目jar包 File -> Project Structure     Libarries 添加jar包jna-4.0.0.jar (2)将Data文件夹复制到ICTCLAS2015文件夹下 (3)声明调用分词器的接口,如下: ){ nativeBytes=CLibrary.))))){ ))]])) )) } buf.iterator}def main(args:Array[String]): Unit = { val conf = new SparkConf…