最近CMS系统为了增加查询的匹配率,需要增加拼音检索字段,在网上找到了pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字), 呵呵,看了看他的demo,决定就用它了,因为我在实际使用的时候,需要考虑多音字的不同排列组合,下面的代码就是支持多音字的.

pinyin4j官方网址:http://pinyin4j.sourceforge.net/

    1. import java.util.HashSet;
    2. import java.util.Set;
    3. import net.sourceforge.pinyin4j.PinyinHelper;
    4. import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
    5. import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
    6. import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
    7. import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
    8. import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
    9. public class pinyin4j {
    10. /**
    11. * 字符串集合转换字符串(逗号分隔)
    12. * @author wyh
    13. * @param stringSet
    14. * @return
    15. */
    16. public static String makeStringByStringSet(Set<String> stringSet){
    17. StringBuilder str = new StringBuilder();
    18. int i=0;
    19. for(String s : stringSet){
    20. if(i == stringSet.size() - 1){
    21. str.append(s);
    22. }else{
    23. str.append(s + ",");
    24. }
    25. i++;
    26. }
    27. return str.toString().toLowerCase();
    28. }
    29. /**
    30. * 获取拼音集合
    31. * @author wyh
    32. * @param src
    33. * @return Set<String>
    34. */
    35. public static Set<String> getPinyin(String src){
    36. if(src!=null && !src.trim().equalsIgnoreCase("")){
    37. char[] srcChar ;
    38. srcChar=src.toCharArray();
    39. //汉语拼音格式输出类
    40. HanyuPinyinOutputFormat hanYuPinOutputFormat = new HanyuPinyinOutputFormat();
    41. //输出设置,大小写,音标方式等
    42. hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    43. hanYuPinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE)
    44. hanYuPinOutputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
    45. String[][] temp = new String[src.length()][];
    46. for(int i=0;i<srcChar.length;i++){
    47. char c = srcChar[i];
    48. //是中文或者a-z或者A-Z转换拼音(我的需求,是保留中文或者a-z或者A-Z)
    49. if(String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")){
    50. try{
    51. temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat);
    52. }catch(BadHanyuPinyinOutputFormatCombination e) {
    53. e.printStackTrace();
    54. }
    55. }else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int)c<=122)){
    56. temp[i] = new String[]{String.valueOf(srcChar[i])};
    57. }else{
    58. temp[i] = new String[]{""};
    59. }
    60. }
    61. String[] pingyinArray = Exchange(temp);
    62. Set<String> pinyinSet = new HashSet<String>();
    63. for(int i=0;i<pingyinArray.length;i++){
    64. pinyinSet.add(pingyinArray[i]);
    65. }
    66. return pinyinSet;
    67. }
    68. return null;
    69. }
    70. /**
    71. * 递归
    72. * @author wyh
    73. * @param strJaggedArray
    74. * @return
    75. */
    76. public static String[] Exchange(String[][] strJaggedArray){
    77. String[][] temp = DoExchange(strJaggedArray);
    78. return temp[0];
    79. }
    80. /**
    81. * 递归
    82. * @author wyh
    83. * @param strJaggedArray
    84. * @return
    85. */
    86. private static String[][] DoExchange(String[][] strJaggedArray){
    87. int len = strJaggedArray.length;
    88. if(len >= 2){
    89. int len1 = strJaggedArray[0].length;
    90. int len2 = strJaggedArray[1].length;
    91. int newlen = len1*len2;
    92. String[] temp = new String[newlen];
    93. int Index = 0;
    94. for(int i=0;i<len1;i++){
    95. for(int j=0;j<len2;j++){
    96. temp[Index] = strJaggedArray[0][i] + strJaggedArray[1][j];
    97. Index ++;
    98. }
    99. }
    100. String[][] newArray = new String[len-1][];
    101. for(int i=2;i<len;i++){
    102. newArray[i-1] = strJaggedArray[i];
    103. }
    104. newArray[0] = temp;
    105. return DoExchange(newArray);
    106. }else{
    107. return strJaggedArray;
    108. }
    109. }
    110. /**
    111. * @param args
    112. */
    113. public static void main(String[] args) {
    114. String str = "单田芳";
    115. System.out.println(makeStringByStringSet(getPinyin(str)));
    116. }
    117. }
    118. 控制台输出:dantianfang,shantianfang,chantianfang

java开源类库pinyin4j的使用的更多相关文章

  1. 【转】java开源类库pinyin4j的使用

    最近CMS系统为了增加查询的匹配率,需要增加拼音检索字段,在网上找到了pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字), 呵呵,看了看他的demo,决定就用它了,因为我在实际使 ...

  2. Atitit java onvif 开源类库 getProfiles getStreamUri

    Atitit java onvif 开源类库 getProfiles getStreamUri 1. ONVIF Java Library by Milgo1 1.1. https://github. ...

  3. Java 的 JSON 开源类库选择比较(zz)

    在看了作者的介绍,然后我又到mvnrepository上去看了各个库的的使用数之后,发现只能在jackson和gson之间做选择. 以下是原文 有效选择七个关于Java的JSON开源类库 April  ...

  4. 浅谈 Java 主流开源类库解析 XML

    在大型项目编码推进中,涉及到 XML 解析问题时,大多数程序员都不太会选用底层的解析方式直接编码. 主要存在编码复杂性.难扩展.难复用....,但如果你是 super 程序员或是一个人的项目,也不妨一 ...

  5. 国人开源了一款小而全的 Java 工具类库,厉害啊!!

    最近栈长看到了一款小而全的 Java 工具类库:Hutool,Github 已经接近 14K Star 了,想必一定很优秀,现在推荐给大家,很多轮子不要再造了! Hutool 是什么 Hutool 是 ...

  6. Java开源中文分词类库

      IKAnalyzer  IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本.最初,它是以开 ...

  7. 一些iOS高效开源类库

    因为iOS SDK相对比较底层,所以开发者就得受累多做一些体力活.不过幸运的是,有很多第三方的类库可以用来简化很多不必要的工作.笔者整理了一下在本人学习过程中用到的一些比较有用Objective-C开 ...

  8. [转]C#常用开源类库收集

    .net PDF 类库 PDFsharp PDFsharp是一款可以让.NET框架支持的任何语言很容易的创建PDF文件的类库. ASP.NET FO PDF FO PDF 是一款C#编写类似于ASP. ...

  9. C#常用开源类库

    一.AOP框架        Encase 是C#编写开发的为.NET平台提供的AOP框架.Encase 独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式.这种 ...

随机推荐

  1. iOS下拉刷新和上拉刷新

    在iOS开发中,我们经常要用到下拉刷新和上拉刷新来加载新的数据,当前这也适合分页.iOS原生就带有该方法,下面就iOS自带的下拉刷新方法来简单操作. 上拉刷新 1.在TableView里,一打开软件, ...

  2. 总结C#获取当前路径的7种方法

    C#获取当前路径的方法如下: 1. System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName -获取模块的完整路径. 2. ...

  3. tfs代码上传到server并下载到新位置

    1.svn与git代码管理原理基本一致,基于文档管理,能看到文件代码,通过设置文件的只读属性来控制代码. 而tfs是基于sqlserver及lock来管理,看不见代码文件 2.tfs没有自己的用户管理 ...

  4. windows上备份mysql数据库

    方案一:采用mysql自带的工具mysqldump. 脚本文件backup.bat如下: set  "YMD=%date:~,4%%date:~5,2%%date:~8,2%"cd ...

  5. uva10167

    /* 暴力 过了 要使得两半的 樱桃数目相等 去试每一个斜率 还好他这里要的是 A.B 都为正整数 这样范围就锁定在200*100 个点范围内 */ #include <cstdio> # ...

  6. 查看firefox浏览器 驱动geckodriver.exe文件的版本号的方法,以及下载链接

    1-进入到geckodriver.exe文件的目录: 2-在路径栏下输入cmd: 3-命令行界面下输入:geckodriver.exe -h 可以看到文件的帮助信息,其中第一行就列出了版本号 为0.1 ...

  7. 汽车变智能只靠ADAS?麦克风也是主角

    在先进驾驶辅助系统(ADAS)中,结合视觉处理器的CMOS影像感测器已在协助汽车辨识与分类方面发挥关键作用.至于其“听觉”呢? 麦克风也能扮演像摄影机般重要的角色,为自动驾驶车增添更多“智慧”功能吗? ...

  8. 华为C/C++笔试题&答案

    1.static有什么用途?(请至少说明两种) 1)在函数体,一个被声明为静态的变量在这一函数被调用过程中维持其值不变. 2) 在模块内(但在函数体外),一个被声明为静态的变量可以被模块内所用函数访问 ...

  9. Tomcat的work目录作用

    Tomcat的work目录作用 很多网友喜欢把tomcat的work目录里的东西叫做缓存,其实那不是很恰当,work目录只是tomcat的工作目录,也就是tomcat把jsp转换为class文件的工作 ...

  10. 计算两个集合的差集——第六期 Power8 算法挑战赛

    第六期Power8大赛 1.1 比赛题目 题目: 计算两个集合的差集: 详细说明: 分别有集合A和B两个大数集合,求解集合A与B的差集(A中有,但B中无的元素),并将结果保存在集合C中,要求集合C中的 ...