paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.

mmseg默认词库只能是文件格式...不好维护..要是不个词库放的个数据库里面走好维护兰..

要实现2个目标..:

1.禁用默认词库,仅仅使用自定义词库

2.词库从数据库读取,而不使用默认的文件方式,方便维护..

作者Attilax 艾龙， EMAIL:1466519819@qq.com

来源：attilax的专栏

地址：http://blog.csdn.net/attilax

Dictionary.getInstance("")来的禁用默认词库,无效果...

查看Dictionary.loadDic 源码...看来无法通过dic = Dictionary.getInstance("");的方式来禁用它的默认词库...

只好扩展Dictionary了..new 了一个class,继承了Dictionary,重写loadDic方法...change 孪一瓦方法的..visiablity...这个方法虽然能行,要overwrite一瓦方法了.麻烦.半路儿上放弃...

换个丝路,不个哪加载的词库在给他卸除孪走ok兰吗.haha...

dic = Dictionary.getInstance();

//delete default words

Map<Character, CharNode> dict=dic.getDict();

Set set=dict.keySet();

Iterator<Character> it = set.iterator();

while (it.hasNext()) {

Character key = it.next();

// String val=String.valueOf( dict.get(key));

CharNode cn=dict.get(key);

cn.ktWordTails=new KeyTree();

}

这样,走禁用孪默认词库兰...完成孪1半儿兰..

词库从数据库读取到list,如何不个这个List动态加载到mmseg呢??

List<String> li=new ArrayList<String>();

li.add("上学好");

li.add("卖衣裳");

for(String word:li)

{

if(word.trim().length()==0 || word.length()<2)

continue;

String line=word;

CharNode cn = dict.get(line.charAt(0));

if(cn == null) {

cn = new CharNode();

dict.put(line.charAt(0), cn);

}else

cn.addWordTail(dic.tail(line));

}

扎实ok兰..哈

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.的更多相关文章

paip.禁用IKAnalyzer 的默认词库.仅仅使用自定义词库.
paip.禁用IKAnalyzer 的默认词库.仅仅使用自定义词库. 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http:// ...
【自定义IK词典】Elasticsearch之中文分词器插件es-ik的自定义词库
Elasticsearch之中文分词器插件es-ik 针对一些特殊的词语在分词的时候也需要能够识别有人会问,那么,例如: 如果我想根据自己的本家姓氏来查询,如zhouls,姓氏“周”. 如 ...
IKAnalyzer 添加扩展词库和自定义词
原文链接http://blog.csdn.net/whzhaochao/article/details/50130605 IKanalyzer分词器 IK分词器源码位置 http://git.osch ...
31.IK分词器配置文件讲解以及自定义词库
主要知识点: 知道IK默认的配置文件信息自定义词库一.ik配置文件 ik配置文件地址:es/plugins/ik/config目录 IKAnalyzer.cfg.xml:用 ...
30.IK分词器配置文件讲解以及自定义词库
主要知识点: 知道IK默认的配置文件信息自定义词库一.ik配置文件 ik配置文件地址:es/plugins/ik/config目录 IKAnalyzer.cfg.xml:用 ...
ElasticSearch7.3学习(十五)----中文分词器(IK Analyzer)及自定义词库
1. 中文分词器 1.1 默认分词器先来看看ElasticSearch中默认的standard 分词器,对英文比较友好,但是对于中文来说就是按照字符拆分,不是那么友好. GET /_analyze ...
C++11之使用或禁用对象的默认函数
[C++11之使用或禁用对象的默认函数] C++11 允许显式地表明采用或拒用编译器提供的内置函数.例如要求类型带有默认构造函数,可以用以下的语法: 另一方面,也可以禁止编译器自动产生某些函数.如下面 ...
Java——word分词·自定义词库
word: https://github.com/ysc/word word-1.3.1.jar 需要JDK8word-1.2.jar c语言给解析成了“语言”,自定义词库必须为UTF-8 程序一旦运 ...
【转载】IOS之禁用UIWebView的默认交互行为
原文地址 :IOS之禁用UIWebView的默认交互行为 http://my.oschina.net/hmj/blog/111344 UIKit提供UIWebView组件,允许开发者在App中嵌入We ...

随机推荐

machine learning----->谷歌Cloud Machine Learning平台
1.谷歌Cloud Machine Learning平台简介: 机器学习的三要素是数据源.计算资源和模型.谷歌在这三个方面都有强大的支撑:谷歌不仅有种类丰富且数量庞大的数据资源,而且有强大的计算机群提 ...
MCS-51系列特殊功能寄存器（摘抄）
1． P0 (80H) P0.7 P0.6 P0.5 P0.4 P0.3 P0.2 P0.1 P0.0 2．SP 栈指针(81H) 3．DPTR 数据指针(由DPH和DPL组成) DPL 数据指针低八 ...
第三十五章 metrics（3）- codahale-metrics基本使用
 <dependency> <groupId>io.dropwizard.metrics</groupId> <a ...
Web 登陆界面---简单模块1
今天学习登陆界面的基本模块,其中几个基本的元素 a元素.form元素.布局元素(table\tr\td).加粗(b).input元素 1.<a href="">内容&l ...
workerman 的属性
<?php /** * Created by PhpStorm. * User: zeopean * Date: 2016-08-26 * Time: 16:35 */ use Workerma ...
咏南IOCP中间件支持海量并发方案（集群）
咏南IOCP中间件支持海量并发方案(集群) 支持D7~XE10.1.1开发支持负载均衡,自动故障转移可以在不停机的状态下,根据负载情况灵活增加中间件机器中间件使用IOCP通信,单中间件支持并发数 ...
XE3随笔8：关于乱码
以下例子都会出现乱码, 虽然都可以有变通的方案, 但如果不乱码就太好了! unit Unit1; interface uses Windows, Messages, SysUtils, Varia ...
我开发的Quartz Cron表达式生成器
Cron Expressions——Cron 表达式 Cron表达式被用来配置CronTrigger实例.Cron表达式是一个由7个子表达式组成的字符串.每个子表达式都描述了一个单独的日程细节.这些子 ...
STF（SmartPhone Test Farm）Mac版本环境搭建
它的github页面为: https://github.com/openstf/stf 1.Linux一些基本包的安装: 在控制台分别运行 sudo apt-get update sudo apt-g ...
FreeBSD_11-系统管理——{Part_1-桌面}
一.Xorg 安装 xorg pkg install xorg 清除旧文件(如果已前安装过 xorg) /etc/X11/xorg.conf /usr/local/etc/X11/xorg.conf ...

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.的更多相关文章

随机推荐

热门专题