java开源类库pinyin4j的使用
最近CMS系统为了增加查询的匹配率,需要增加拼音检索字段,在网上找到了pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字), 呵呵,看了看他的demo,决定就用它了,因为我在实际使用的时候,需要考虑多音字的不同排列组合,下面的代码就是支持多音字的.
pinyin4j官方网址:http://pinyin4j.sourceforge.net/
- import java.util.HashSet;
- import java.util.Set;
- import net.sourceforge.pinyin4j.PinyinHelper;
- import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
- import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
- import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
- import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
- import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
- public class pinyin4j {
- /**
- * 字符串集合转换字符串(逗号分隔)
- * @author wyh
- * @param stringSet
- * @return
- */
- public static String makeStringByStringSet(Set<String> stringSet){
- StringBuilder str = new StringBuilder();
- int i=0;
- for(String s : stringSet){
- if(i == stringSet.size() - 1){
- str.append(s);
- }else{
- str.append(s + ",");
- }
- i++;
- }
- return str.toString().toLowerCase();
- }
- /**
- * 获取拼音集合
- * @author wyh
- * @param src
- * @return Set<String>
- */
- public static Set<String> getPinyin(String src){
- if(src!=null && !src.trim().equalsIgnoreCase("")){
- char[] srcChar ;
- srcChar=src.toCharArray();
- //汉语拼音格式输出类
- HanyuPinyinOutputFormat hanYuPinOutputFormat = new HanyuPinyinOutputFormat();
- //输出设置,大小写,音标方式等
- hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
- hanYuPinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE)
- hanYuPinOutputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
- String[][] temp = new String[src.length()][];
- for(int i=0;i<srcChar.length;i++){
- char c = srcChar[i];
- //是中文或者a-z或者A-Z转换拼音(我的需求,是保留中文或者a-z或者A-Z)
- if(String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")){
- try{
- temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat);
- }catch(BadHanyuPinyinOutputFormatCombination e) {
- e.printStackTrace();
- }
- }else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int)c<=122)){
- temp[i] = new String[]{String.valueOf(srcChar[i])};
- }else{
- temp[i] = new String[]{""};
- }
- }
- String[] pingyinArray = Exchange(temp);
- Set<String> pinyinSet = new HashSet<String>();
- for(int i=0;i<pingyinArray.length;i++){
- pinyinSet.add(pingyinArray[i]);
- }
- return pinyinSet;
- }
- return null;
- }
- /**
- * 递归
- * @author wyh
- * @param strJaggedArray
- * @return
- */
- public static String[] Exchange(String[][] strJaggedArray){
- String[][] temp = DoExchange(strJaggedArray);
- return temp[0];
- }
- /**
- * 递归
- * @author wyh
- * @param strJaggedArray
- * @return
- */
- private static String[][] DoExchange(String[][] strJaggedArray){
- int len = strJaggedArray.length;
- if(len >= 2){
- int len1 = strJaggedArray[0].length;
- int len2 = strJaggedArray[1].length;
- int newlen = len1*len2;
- String[] temp = new String[newlen];
- int Index = 0;
- for(int i=0;i<len1;i++){
- for(int j=0;j<len2;j++){
- temp[Index] = strJaggedArray[0][i] + strJaggedArray[1][j];
- Index ++;
- }
- }
- String[][] newArray = new String[len-1][];
- for(int i=2;i<len;i++){
- newArray[i-1] = strJaggedArray[i];
- }
- newArray[0] = temp;
- return DoExchange(newArray);
- }else{
- return strJaggedArray;
- }
- }
- /**
- * @param args
- */
- public static void main(String[] args) {
- String str = "单田芳";
- System.out.println(makeStringByStringSet(getPinyin(str)));
- }
- }
- 控制台输出:dantianfang,shantianfang,chantianfang
java开源类库pinyin4j的使用的更多相关文章
- 【转】java开源类库pinyin4j的使用
最近CMS系统为了增加查询的匹配率,需要增加拼音检索字段,在网上找到了pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字), 呵呵,看了看他的demo,决定就用它了,因为我在实际使 ...
- Atitit java onvif 开源类库 getProfiles getStreamUri
Atitit java onvif 开源类库 getProfiles getStreamUri 1. ONVIF Java Library by Milgo1 1.1. https://github. ...
- Java 的 JSON 开源类库选择比较(zz)
在看了作者的介绍,然后我又到mvnrepository上去看了各个库的的使用数之后,发现只能在jackson和gson之间做选择. 以下是原文 有效选择七个关于Java的JSON开源类库 April ...
- 浅谈 Java 主流开源类库解析 XML
在大型项目编码推进中,涉及到 XML 解析问题时,大多数程序员都不太会选用底层的解析方式直接编码. 主要存在编码复杂性.难扩展.难复用....,但如果你是 super 程序员或是一个人的项目,也不妨一 ...
- 国人开源了一款小而全的 Java 工具类库,厉害啊!!
最近栈长看到了一款小而全的 Java 工具类库:Hutool,Github 已经接近 14K Star 了,想必一定很优秀,现在推荐给大家,很多轮子不要再造了! Hutool 是什么 Hutool 是 ...
- Java开源中文分词类库
IKAnalyzer IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本.最初,它是以开 ...
- 一些iOS高效开源类库
因为iOS SDK相对比较底层,所以开发者就得受累多做一些体力活.不过幸运的是,有很多第三方的类库可以用来简化很多不必要的工作.笔者整理了一下在本人学习过程中用到的一些比较有用Objective-C开 ...
- [转]C#常用开源类库收集
.net PDF 类库 PDFsharp PDFsharp是一款可以让.NET框架支持的任何语言很容易的创建PDF文件的类库. ASP.NET FO PDF FO PDF 是一款C#编写类似于ASP. ...
- C#常用开源类库
一.AOP框架 Encase 是C#编写开发的为.NET平台提供的AOP框架.Encase 独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式.这种 ...
随机推荐
- iOS UI基础-2.0按钮操作与形变
按钮状态 1.normal:默认状态 Default 对应的枚举常量:UIControlStateNormal 2.highlighted(高亮状态) 按钮被按下去的时候(未松开) 对应的枚举常量 ...
- js值类型和引用类型的区别
1:赋值 值类型的赋值:直接将存储的数据赋值一份进行赋值,两份数据在内存中是完全独立的. 引用类型赋值:引用类型的赋值的时候,是将变量中的存储的地址赋值一份单独存储,但是两个变量中修改其中一个对象,另 ...
- uva 13598
/* 题目的大意是 给你 N 学生 然后 给前 K个学生编号了 给定的 号码 , 然后你按照 使得接下来学生 学号尽量小的 方法 从第 K+1个学生开始编号 每个号码 自然只能用一次, 解答 : 先将 ...
- leetcode_目录
3Sum Closest 3Sum 4Sum Add Binary Add Two Numbers Anagrams Balanced Binary Tree Best Time to Buy and ...
- Python之路----列表推导式和生成器的表达式
列表推导式 egg_list=['鸡蛋%s'%i for i in range(10)] print(egg_list) 列表推导式 推导过程 egg_list = [] for i in range ...
- java网络基础知识的简述
TCP/UDP的介绍 TCP协议:面向连接的,字节流无差错地传输协议. UDP协议:一个不可靠的无连接的数据传输协议. 说明:TCP可以想象成电话通讯,双方在通话时必须建立连接,一方没听清,会要求对方 ...
- Linux下useradd命令创建的用户不能登录的问题
Linux下useradd命令创建的用户不能登录的问题 问题: 用useradd命令新创建一个用户tester 密码pwdtest mkdir -p /home/tester(创建文件夹) user ...
- Arduino使用HC05蓝牙模块与手机连接
Arduino使用HC05蓝牙模块与手机连接 一切都是最好的选择 首先是线路连接,一定不要接错了 Arduino 代码 #include <SoftwareSerial.h> // Pin ...
- Python3基础 str format 输出花括号{}
Python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 Conda ...
- P3466 [POI2008]KLO-Building blocks
目录 题目 思路 错误 代码 题目 luogu csdn好像限制了展开博客次数,真的好xx 思路 显然一段区间内的值一定是他的中位数 少一点比多一点好 然后就可以枚举区间了 区间答案为 val[mid ...