PinyinUtil
import java.util.HashSet;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
/**
* 拼音使用工具类 </br> 功能: 输入汉字取得拼音。 <br>
* 使用Pinyin4j.jar
*
*/
public class PinyinUtil {
/**
* 获取中文汉字拼音 默认输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyin(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese));
}
/**
* 拼音大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToUpperCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toUpperCase();
}
/**
* 拼音小写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToLowerCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toLowerCase();
}
/**
* 首字母大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinFirstToUpperCase(String chinese) {
return getPinyin(chinese);
}
/**
* Default Format 默认输出格式 小或大写、 没有音调数字、u显示
*
* @param isLowerCase
* 是否小写
* @return
*/
private static HanyuPinyinOutputFormat getDefaultFormat() {
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);// 小写
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 没有音调数字
format.setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);// u显示
return format;
}
/**
* 字符集转换
*
* @param chinese
* 中文汉字
* @throws BadHanyuPinyinOutputFormatCombination
*/
private static Set<String> convertStringByChinese(String chinese) {
char[] chars = chinese.toCharArray();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
char[] srcChar = chinese.toCharArray();
String[][] temp = new String[chinese.length()][];
for (int i = 0; i < srcChar.length; i++) {
char c = srcChar[i];
// 是中文(a-z、A-Z)转换拼音
if (String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")
|| String.valueOf(c).matches("[\\u3007]")) {
try {
temp[i] = PinyinHelper.toHanyuPinyinStringArray(chars[i], getDefaultFormat());
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
temp[i] = new String[] { String.valueOf(srcChar[i]) };
}
}
String[] pingyinArray = exchange(temp);
Set<String> pinyin = new HashSet<String>();
for (int i = 0; i < pingyinArray.length; i++) {
pinyin.add(pingyinArray[i]);
}
return pinyin;
}
return null;
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[] exchange(String[][] strJaggedArray) {
String[][] temp = doExchange(strJaggedArray);
return temp[0];
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[][] doExchange(String[][] strJaggedArray) {
int len = strJaggedArray.length;
if (len >= 2) {
int len1 = strJaggedArray[0].length;
int len2 = strJaggedArray[1].length;
int newlen = len1 * len2;
String[] temp = new String[newlen];
int index = 0;
for (int i = 0; i < len1; i++) {
for (int j = 0; j < len2; j++) {
temp[index] = capitalize(strJaggedArray[0][i])
+ capitalize(strJaggedArray[1][j]);
index++;
}
}
String[][] newArray = new String[len - 1][];
for (int i = 2; i < len; i++) {
newArray[i - 1] = strJaggedArray[i];
}
newArray[0] = temp;
return doExchange(newArray);
} else {
return strJaggedArray;
}
}
/**
* 首字母大写
*
* @param s
* @return
*/
private static String capitalize(String s) {
char[] ch = s.toCharArray();
if (ch != null && ch.length > 0) {
if (ch[0] >= 'a' && ch[0] <= 'z')
ch[0] = (char) (ch[0] - 32);
}
return new String(ch);
}
/**
* 字符串集合转换字符串(逗号分隔)
*
* @param stringSet
* @return
*/
private static String getPinyinZh_CN(Set<String> stringSet) {
StringBuilder str = new StringBuilder();
int i = 0;
for (String s : stringSet) {
if (i == stringSet.size() - 1) {
str.append(s);
} else {
str.append(s + ",");
}
i++;
}
return str.toString();
}
/**
* 返回中文的首字母
*
* @param chinese
* @return
*/
public static String getPinYinHeadChar(String chinese) {
StringBuffer pinyin = new StringBuffer();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
for (int j = 0; j < chinese.length(); j++) {
char word = chinese.charAt(j);
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null) {
pinyin.append(pinyinArray[0].charAt(0));
} else {
pinyin.append(word);
}
}
}
return pinyin.toString();
}
/**
* 去除特殊字符
* @param cnStr
* @return
*/
public static String strFilter(String str) throws PatternSyntaxException {
// 只允许字母和数字
// String regEx = "[^a-zA-Z0-9]";
// 清除掉所有特殊字符
String regEx="[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?\"]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
return m.replaceAll("").trim();
}
/**
* 返回中文的首字母并过滤特殊字符输出
* @param chinese
* @return
*/
public static String getPinYinHeadCharFilter(String chinese) {
return strFilter(getPinYinHeadChar(chinese));
}
/**
* Test 测试
*
* @param args
*/
public static void main(String[] args) throws Exception{
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
// UPPERCASE:大写 (ZHONG)
// LOWERCASE:小写 (zhong)
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
// WITHOUT_TONE:无音标 (zhong)
// WITH_TONE_NUMBER:1-4数字表示英标 (zhong4)
// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常) (zhòng)
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
// WITH_V:用v表示ü (nv)
// WITH_U_AND_COLON:用"u:"表示ü (nu:)
// WITH_U_UNICODE:直接用ü (nü)
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
char word = '区';
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word,format);
for(String e:pinyinArray){
System.out.println(e);//shou
}
// Logger logger = LoggerFactory.getLogger(PinyinUtil.class);
// logger.info(pinyinArray.toString() );
// String str = "〇的输¥¥#s,ldsa";
// logger.info("小写输出:" + getPinyinToLowerCase(str));
// logger.info("大写输出:" + getPinyinToUpperCase(str));
// logger.info("首字母大写输出:" + getPinyinFirstToUpperCase(str));
// logger.info("返回中文的首字母输出:" + getPinYinHeadChar(str));
// logger.info("返回中文的首字母并过滤特殊字符输出:" + getPinYinHeadCharFilter(str));
}
}
PinyinUtil的更多相关文章
- 拼音操作工具类 - PinyinUtil.java
拼音操作工具类,提供字符串转换成拼音数组.汉字转换成拼音.取汉字的首字母等方法. 源码如下:(点击下载 -PinyinUtil.java.pinyin4j-2.5.0.jar ) import net ...
- java加拼音的工具 pinyinutil
<!--汉字转拼音--> <dependency> <groupId>com.belerweb</groupId> <artifactId> ...
- JavaScript 汉字与拼音互转终极方案 附JS拼音输入法
转:http://www.codeceo.com/article/javascript-pinyin.html 前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的 ...
- 【干货】JS版汉字与拼音互转终极方案,附简单的JS拼音输入法
前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的不支持多音字,有的不支持声调,有的字典文件太大,还比如有时候我仅仅是需要获取汉字拼音首字母却要引入200kb的字 ...
- java 中文转化为拼音
依赖架包:pinyin4j.jar package net.jeeshop.core.util; import net.sourceforge.pinyin4j.PinyinHelper; impor ...
- java 汉语转拼音(全拼,首字母)
import java.util.*; import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.for ...
- java中汉字自动转换成拼音
java中汉字自动转换成拼音 1.需要下载jar包 pinyin4j.2.5.0.jar ,加入到WEB-INF下的lib里边,右键add to bulid path. 2.[代码]PinYinUti ...
- pinyin4j使用示例
pinyin4j的主页:http://pinyin4j.sourceforge.net/pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制pinyin4j是一个支持将中文转换到拼 ...
- java 汉字转拼音
先决条件: pinyin4j.jar(Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换.拼音输出格式可以定制.) 下载地址:http://pan.baidu.com/share/l ...
随机推荐
- 8 -- 深入使用Spring -- 6...1 Spring支持的事务策略
8.6.1 Spring支持的事务策略 JTA.JDBC.Hibernate Java EE应用的传统事务有两种策略:全局事务和局部事务.全局事务由应用服务器管理,需要底层服务器的JTA(Java T ...
- ValueError: {0} is not a valid coordinate or range问题解决
获取excel多列方法: >>> colC = ws['C'] >>> col_range = ws['C:D'] 采用python 实现时,开始列与结束列采用变量 ...
- 十三、K3 WISE 开发插件《SQL语句WHERE查询-范围查询/模糊查询》
0.存储过程开头变量定义 ), --单据起始日期 ), --单据截止日期. ), ), ), ), ) @FType varchar(50), --单据类型@FBillNo varchar(50), ...
- 10.16 正式开发stark组件(一)
2018-10-16 17:26:44 Django MTV 路由配置里面有 反向解析 参考连接:https://www.cnblogs.com/yuanchenqi/articles/762993 ...
- spring整合Jersey 无法注入service的问题
现象: action中的@autowired注入service或dao失败,报空指针异常 原因: 造成该问题的原因是你并没有做好spring和jersey的整合工作,检查你的web.xml文件,jer ...
- Could not write file: C:\......\.classpath
最近因为换操作系统,把项目从Mac系统copy到了win10下,出现了不少项目部署启动上的问题.最开始的一个问题是:Could not write file: C:\......\.classpath ...
- 洛谷P1032 字串变换【bfs】
题目链接:https://www.luogu.org/problemnew/show/P1032 题意: 给定一个原字符串和目标字符串,以及几个字符串变换的规则. 问能否根据这几个规则在十步之内把原字 ...
- 洛谷 P1223排队接水【贪心】
题目描述 有n个人在一个水龙头前排队接水,假如每个人接水的时间为Ti,请编程找出这n个人排队的一种顺序,使得n个人的平均等待时间最小. 输入输出格式 输入格式: 输入文件共两行,第一行为n:第二行分别 ...
- 分块+莫队||BZOJ3339||BZOJ3585||Luogu4137||Rmq Problem / mex
题面:P4137 Rmq Problem / mex 题解:先莫队排序一波,然后对权值进行分块,找出第一个没有填满的块,直接for一遍找答案. 除了bzoj3339以外,另外两道题Ai范围都是1e9. ...
- {Django基础六之ORM中的锁和事务}一 锁 二 事务
Django基础六之ORM中的锁和事务 本节目录 一 锁 二 事务 一 锁 行级锁 select_for_update(nowait=False, skip_locked=False) #注意必须用在 ...