汉字转拼音 oracle方式 [转]】的更多相关文章

oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等)   效果如下: Oracle 字符集 GBK 没有问题 , UTF -8 需要修改一下   Sql代码   --oracle汉字转拼音 PACKAGE    --1.获得全拼  SELECT GETHZPY.GETHZFULLPY('汉字') FROM DUAL;   结果 : HanZi    --2.拼音首字母   SELECT GETHZPY.GETHZPYCAP('汉字') FROM DUAL;   结果 : HZ    --3…
参见戴明明的博客,oracle 根据汉字返回拼音函数,由于他的博客里没有提供完整的代码,研究了一个多小时,才弄出来: 上来贴代码吧.. --------------Type Definition CREATE OR REPLACE TYPE spell_code AS OBJECT( spell varchar2(10),  code Varchar2(10)); -------------Create Table Type CREATE OR REPLACE TYPE t_spellcode…
前言: 最近处理一个特殊的问题,需要用到汉字自动转换拼音的功能. 解决: 在这里找了不少资料,都是有所缺陷,而且也好像很绕.其实是一个很简单的东东.后来还是自己写了一个函数获取.分享出来,给有需要的XD了. ------------- 这是一个比较简单的汉字转拼音的Oracle函数写法. 原理是,先将汉字对应的拼音存入一个表格. 然后对这个表格对应的存在的汉字找出其拼音,然后输出. 这样子做,容易维护,而且也容易扩展.如果万一发现哪个字少了,直接增加表格记录即可. 步骤如下: ----建立汉字拼…
    oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等)   效果如下: Oracle 字符集 GBK 没有问题 , UTF -8 需要修改一下   Sql代码   --oracle汉字转拼音 PACKAGE    --1.获得全拼  www.2cto.com   SELECT GETHZPY.GETHZFULLPY('汉字') FROM DUAL;   结果 : HanZi    --2.拼音首字母   SELECT GETHZPY.GETHZPYCAP('汉字') FROM DUA…
oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等) 效果如下: Oracle 字符集 GBK 没有问题 , UTF -8 需要修改一下 Sql代码 --oracle汉字转拼音 PACKAGE --1.获得全拼  www.2cto.com SELECT GETHZPY.GETHZFULLPY('汉字') FROM DUAL; 结果 : HanZi --2.拼音首字母 SELECT GETHZPY.GETHZPYCAP('汉字') FROM DUAL; 结果 : HZ --3.拼音截取等 S…
之前由于项目需要,中间需要一个汉字转拼音和首拼的功能来做查询,感觉这种功能基本已经成熟化了,于是查找了相关的代码,首先引入眼帘的是下面两篇文章 1.C# 汉字转拼音(支持GB2312字符集中所有汉字) 2.[干货]JS版汉字与拼音互转终极方案,附简单的JS拼音输入法 感谢两位博主,写的比较全也很详细,都有提供源码,大家可以参考下. 由于考虑到接口的需要,于是参考了 第一篇,文章中作者的源码基本能满足汉字转拼音的需要,对于其他特殊的字符,也可以在进行添加补充,不足之处就是不支持多音字,由于需要支持…
import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourcefor…
GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个. 分区表示  GB 2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号.这种表示方式也称为区位码. )-09区为特殊符号. )-55区为一级汉字,按拼音排序.  )-87区为二级汉字,按部首/笔画排序. )-15区及88-94区则未有编码. 也就是说二级汉字与拼音不存在联系.这样网上大部分汉字转拼音类只能正确获取部分汉字的拼音(一级汉字).只有小数的3000多一点汉字.  而二级汉字根本查询不到,比如…
方法一:依据ASCII码转换,GB2312库对多音字也无能为力. GB2312标准共收录6763个汉字,不在范围内的汉字是无法转换.如:中国前总理朱镕基的"镕"字. GB2312中对所收汉字进行了"分区"处理,每区含有94个汉字/符号.这样的表示方式也称为区位码.01-09区为特殊符号.16-55区为一级汉字.按拼音排序.(3755个)56-87区为二级汉字.按部首/笔画排序.(3008个)10-15区及88-94区则未有编码.占用的码位是72*94=6768. 当…
最近项目上使用到汉字排序的问题,网上搜索了一下后普遍使用下面的方法比较. @Test public void test_sort_pinyin() { Collator cmp = Collator.getInstance(java.util.Locale.CHINA); String[] arr = { "张三", "李四", "王五", "赵六", "JAVA", "123", &q…