language-detection 语言检测工具 java版的应用demo
本文基本借鉴大佬文章:http://www.cnblogs.com/makemelaugh/archive/2012/09/26/2704802.html
在此基础上添加一些自己的补充,方便查阅。
提前需要下载的jar包:
谷歌code的 language-detection下载地址:https://code.google.com/archive/p/language-detection/downloads
github上的 language-detection下载地址(这个里面有各国语言的语料包):https://github.com/optimaize/language-detector
JSONIC的jar包下载地址: https://zh.osdn.net/projects/jsonic/
项目中需要引用langdetect.jar和其依赖的jsonic.jar (项目中只需要把jar包和语料包拿过来就可以了)
简单例子如下:
Demo截图(红圈内分别为引用的jar包,语料包以及获取配置文件key的工具类):

例子贴上:
package langDetectionTest.langDetection;
import com.cybozu.labs.langdetect.Detector;
import com.cybozu.labs.langdetect.DetectorFactory;
import com.cybozu.labs.langdetect.LangDetectException;
import langDetectionTest.tools.PropertiesUtil;
/**
* Created by xinlian on 2017/7/20.
*/
public class Test {
public static void main(String[] args) {
try {
//根据路径加载语料包(PropertiesUtil是用来获取配置文件中的配置的语料包路径)
DetectorFactory.loadProfile(PropertiesUtil.getProperty("config.properties ", "langdir"));
} catch (LangDetectException e) {
e.printStackTrace();
}
Detector detect;
try {
detect = DetectorFactory.create();
//需要检测的语言
detect.append("这是一段中文");
System.out.println(detect.detect());
} catch (LangDetectException e) {
e.printStackTrace();
}
}
}
PropertiesUtil工具类贴上:
package langDetectionTest.tools;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.Properties;
public class PropertiesUtil {
private static Properties properties;
private static Map<String ,Properties> propertiesMap = new HashMap<String ,Properties>();
/**
* 初始化properties文件
* @Title: initProperties
* @data:2016-6-27下午12:44:19
* @author:bagen
*
* @param file
*/
private static void initProperties(String file) {
properties = new Properties();
try {
ClassLoader loader = PropertiesUtil.class.getClassLoader();
java.io.InputStream inStream = loader.getResourceAsStream(file);
if(inStream != null) {
properties.load(inStream);
}
propertiesMap.put(file, properties);
} catch (IOException e) {
e.printStackTrace();
}
}
/**
* 从缓存Map获取值
* @Title: getProperties
* @data:2016-6-27下午12:59:01
* @author:bagen
*
* @param file
* @return
*/
public static Properties getProperties(String file){
Properties properties = null;
if(propertiesMap.containsKey(file)){
properties = (Properties) propertiesMap.get(file);
}
return properties;
}
/**
* 获取properties中的值
* @Title: getProperty
* @data:2016-6-27下午12:51:03
* @author:bagen
*
* @param file
* @param key
* @return
*/
public static String getProperty(String file, String key) {
if(!propertiesMap.containsKey(file))
initProperties(file);
return getProperties(file).getProperty(key);
}
}
运行结果:

demo百度云地址: http://pan.baidu.com/s/1bJvICQ
以上。
language-detection 语言检测工具 java版的应用demo的更多相关文章
- Java静态检测工具/Java代码规范和质量检查简单介绍(转)
静态检查: 静态测试包括代码检查.静态结构分析.代码质量度量等.它可以由人工进行,充分发挥人的逻辑思维优势,也可以借助软件工具自动进行.代码检查代码检查包括代码走查.桌面检查.代码审查等,主要检查代码 ...
- Android For JNI(一)——JNI的概念以及C语言开发工具dev-c++,编写你的第一个C语言程序,使用C启动JAVA程序
Android For JNI(一)--JNI的概念以及C语言开发工具dev-c++,编写你的第一个C语言程序 当你的Android之旅一步步的深入的时候,你其实会发现,很多东西都必须去和framew ...
- 数据结构与抽象 Java语言描述 第4版 pdf (内含标签)
数据结构与抽象 Java语言描述 第4版 目录 前言引言组织数据序言设计类P.1封装P.2说明方法P.2.1注释P.2.2前置条件和后置条件P.2.3断言P.3Java接口P.3.1写一个接口P.3. ...
- 三分钟极速体验:Java版人脸检测
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- Java版人脸检测详解上篇:运行环境的Docker镜像(CentOS+JDK+OpenCV)
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- Java版人脸检测详解下篇:编码
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- 三分钟:极速体验JAVA版目标检测(YOLO4)
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- JCEF3——谷歌浏览器内核Java版实现(一):使用jawt获取窗体句柄
前言 最近一段时间研究谷歌浏览器内核.谷歌浏览器内核一直开源,并维护更新,它的开源项目中内核更新速度和Chrome浏览器版本更新进度一样!而且它不同于WebKit(值得一题的是谷歌浏览器已不使用Web ...
- 第八篇 :微信公众平台开发实战Java版之如何网页授权获取用户基本信息
第一部分:微信授权获取基本信息的介绍 我们首先来看看官方的文档怎么说: 如果用户在微信客户端中访问第三方网页,公众号可以通过微信网页授权机制,来获取用户基本信息,进而实现业务逻辑. 关于网页授权回调域 ...
随机推荐
- linux下部署php项目-Apache、php、mysql关联
linux下部署php项目环境可以分为两种,一种使用Apache,php,mysql的压缩包安装,一种用yum命令进行安装. 使用三种软件的压缩包进行安装,需要手动配置三者之间的关系.apache和p ...
- Bottle源码阅读笔记(一):WSGI
前言 Bottle是一个Python Web框架.整个框架只有一个文件,不到4k行的代码,没有Python标准库以外的依赖,却包含了路由.模板和插件等Web框架常用功能.通过阅读Bottle源码来了解 ...
- 分清css的em和rem
在css中单位长度用的最多的是px.em.rem,这三个的区别是: px是固定的像素,一旦设置了就无法因为适应页面大小而改变. em和rem相对于px更具有灵活性,他们是相对长度单位,意思是长度不是定 ...
- C#简单构架之EF进行读写分离+多数据库(Mysql/SqlService)
最近因为项目需要,研究了下EF的读写分离,所以做了一个demo进行测试,下面是项目的结构 表现层view 主要提供Web.WebApi等表现层的解决方案 公共层public 主要提供项目公共类库,数据 ...
- react-router 参数获取
No BB!!! show me the code. Main.js import { BrowserRouter, Route, Link ,Switch} from 'react-router-d ...
- 深入理解 JavaScript 事件循环(一)— event loop
引言 相信所有学过 JavaScript 都知道它是一门单线程的语言,这也就意味着 JS 无法进行多线程编程,但是 JS 当中却有着无处不在的异步概念 .在初期许多人会把异步理解成类似多线程的编程模式 ...
- Why you should QC your reads AND your assembly?
鲤鱼基因组:http://www.ntv.cn/a/20140923/52953.shtml 关于鲤鱼基因组的测定,数据质量控制遭到质疑. Why you should QC your reads ...
- Mysql数据库存储emoji表情
emoji表情需要使用编码格式未utf8mb4,mysql数据库版本要5.5以上,我用的是5.6,因为只有5.5以上支持utf8mb4. 1.数据库编码设定为utf8mb4,如果建库时指定的是utf8 ...
- ecshop的aes加密(封装)
从一家做shopex,ecstore的公司到一家做b2b的ecshop的公司...来了就要实战,其他的不说了,先来了解什么是php的aes加密吧? aes(高级加密标准),AES的区块长度固定为128 ...
- Notepad++中过滤掉的正则方式
2 => 'ashadv'3 => 'aogro'4 => 'aogs'5 => 'ashamw'6 => 'arc'8 => 'gtsatq'9 => 'b ...