简单测试--C#实现中文汉字转拼音首字母
第一种:
这个是自己写的比较简单的实现方法,要做汉字转拼音首字母,首先应该有一个存储首字母的数组,然后将要转拼音码的汉字与每个首字母开头的第一个汉字即“最小”的汉字作比较,这里的最小指的是按拼音规则比较最小,例如a比h小,所以“爱”比“恨”小,同一个字母开头的拼音比较大小以此类推。最后实现的结果是只转汉字,对于中文特殊字符、标点符号和英文都原样输出,不转码。
实现方法如下:
using System;
using System.Collections.Generic;
using System.Globalization;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;//先导入这个使用正则表达式 namespace WritePinYin
{ public class SimplePinYin
{
//汉字每个首字母的拼音中最小的字,顺序不能乱
private static char[] firstcn = { '帀', '丫', '夕', '屲', '他', '仨', '呥', '七',
'妑', '噢', '拏', '嘸', '垃', '咔', '丌', '铪',
'旮', '发', '妸', '咑', '嚓', '八', '吖' };
//所有汉字首字母
private static char[] firsten = { 'Z', 'Y', 'X', 'W', 'T', 'S', 'R', 'Q',
'P', 'O', 'N', 'M', 'L', 'K', 'J', 'H',
'G', 'F', 'E', 'D', 'C', 'B', 'A' }; /// <summary>
/// 汉字转化为拼音首字母
/// </summary>
/// <param name="str">汉字</param>
/// <returns>首字母</returns>
public static string GetFirstPinyin(string strcn)
{
int intlen = strcn.Length;
int index = ;
char chartemp = char.MinValue;
string strtemp = string.Empty;
Regex reg = new Regex(@"[\u4e00-\u9fa5]");//\u4e00-\u9fa5用来判断是不是中文的正则表达式
CultureInfo pinyin = new CultureInfo(0x804);//保存区域特定的信息,如关联的语言、子语言、国家/地区、日历和区域性约定,这里表示中文
if (intlen > )
{
char[] strchar = new char[intlen + ];
for (int i = ; i < intlen; i++)
{
strchar[i] = Convert.ToChar(strcn.Substring(i, ));
}
foreach (char cstr in strchar)
{
chartemp = char.MinValue;
if (reg.IsMatch(cstr.ToString()))//对于中文汉字,不包括中文特定字符
{
foreach (char fstr in firstcn)
{
if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= )//将汉字与设定的汉字按拼音比较大小
{
index = Array.IndexOf(firstcn, fstr);
chartemp = firsten[index];
break;
}
}
}
else//对于非中文汉字,不作拼音码处理
{
chartemp = cstr;
}
strtemp += chartemp;
}
}
return strtemp;
} }
}
调用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托尔其!"));
第二种:
参考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.html
使用微软的Visual Studio International Pack 类库提取汉字拼音首字母,首先下载Visual Studio International Pack 1.0,官方下载地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下载完毕后解压,解压后可以发现7个MSI安装文件,其中CHSPinYinConv.msi是汉字拼音组件,CHTCHSConv.msi是进行繁简体互转组件,安装这两个MSI就可以了 (x86操作系统上的默认安装目录是 C:\Program Files\Microsoft Visual Studio International Pack\) 。安装完毕后,需要在VS里添加引用,分别引用:C:\Program Files\Microsoft Visual Studio International Pack\Simplified Chinese Pin-Yin Conversion Library(拼音)下和C:\Program Files\Microsoft Visual Studio International Pack\Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁简互转)下的dll 即可使用。
using Microsoft.International.Converters.PinYinConverter;//导入拼音相关 namespace WebApplication2
{
public class Class1
{
/// <summary>
/// 汉字转化为拼音
/// </summary>
/// <param name="str">汉字</param>
/// <returns>全拼</returns>
public static string GetPinyin(string str)
{
string r = string.Empty;
foreach (char obj in str)
{
try
{
ChineseChar chineseChar = new ChineseChar(obj);
string t = chineseChar.Pinyins[].ToString();
r += t.Substring(, t.Length - );
}
catch
{
r += obj.ToString();
}
}
return r;
} /// <summary>
/// 汉字转化为拼音首字母
/// </summary>
/// <param name="str">汉字</param>
/// <returns>首字母</returns>
public static string GetFirstPinyin(string str)
{
string r = string.Empty;
foreach (char obj in str)
{
try
{
ChineseChar chineseChar = new ChineseChar(obj);
string t = chineseChar.Pinyins[].ToString();
r += t.Substring(, );
}
catch
{
r += obj.ToString();
}
}
return r;
}
}
}
调用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托尔其!"));
简单测试--C#实现中文汉字转拼音首字母的更多相关文章
- Js中文排序(拼音首字母)
演示地址:http://lar5.sinaapp.com/ 1.index.html <html xmlns="http://www.w3.org/1999/xhtml"&g ...
- C#获取包括一二级汉字的拼音 首字母
C#获取包括一二级汉字的拼音 首字母 声母 汉字拼音转换 using System; using System.Collections.Generic; using System.Linq; usin ...
- C# 获取汉字的拼音首字母和全拼(含源码)
C# 获取汉字的拼音首字母 一种是把所有中文字符集合起来组成一个对照表:另一种是依照汉字在Unicode编码表中的排序来确定拼音的首字母.碰到多音字时就以常用的为准(第一种方法中可以自行更改,方法为手 ...
- 获取汉字的拼音首字母--pinyin
var pinyin = (function (){ var Pinyin = function (ops){ this.initialize(ops); }, options = { checkPo ...
- mysql中文字段转拼音首字母,以及中文拼音模糊查询
创建存储过程,将中文字段转拼音首字母 CREATE DEFINER=`root`@`%` FUNCTION `fristPinyin`(P_NAME VARCHAR(255)) RETURNS var ...
- (转载)delphi中获取汉字的拼音首字母
delphi中获取汉字的拼音首字母1.py: array[216..247] of string = ({216}'CJWGNSPGCGNESYPB' + 'TYYZDXYKYGTDJNMJ' + ' ...
- SqlServer 汉字转换拼音首字母函数
CREATE function [dbo].[Func_GetPY](@str nvarchar(4000))returns nvarchar(4000)asbegin set @str=RTRIM( ...
- 汉字转拼音首字母的java实现
工作中经常会遇到的一些排序问题,比如 按汉字的拼音首字母排序,比如人名排序等,就要用到下面的方法了,思路: 1. 获得汉字 2. 将汉字转换成首字母,并记录下(必要时保存到数据库) 3. 按首字母进行 ...
- sql获取汉字的拼音首字母的函数
ql获取汉字的拼音首字母 if exists (select * from sysobjects where id = object_id(N'[fn_ChineseToSpell]') and ...
随机推荐
- redis 在 Linux下的安装
redis 和 nginx 一样,都是C语言编写的,所以我们的准备gcc 环境, 之前已经准备好了 没有准备的话(CentOs 有自带):yum install gcc-c++ 解压redis : ...
- Postgres 的 Range 类型
mysql 不支持 Range 类型 零.介绍 1. 适用场景: a.可以用于实现 是否满足薪资需求 的功能 b.可以用于实现 是否符合上线时间 的功能 一.定义 1.类型范围 Postgres Se ...
- python学习笔记16-装饰器
装饰器(函数) 1.函数作用域 2.高阶函数 把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式. 3.闭包 闭包就是能够读取其他函数内部变量的函数. 在本质上,闭包 ...
- Python小白学习之路(二十三)—【生成器补充】
生成器的一些补充 接着下鸡蛋和吃包子! 补充一:生成器只能遍历一次 (总是把生成器比喻成母鸡下鸡蛋,需要一个下一个,首先是下出来的鸡蛋不能塞回母鸡肚子里,其次是一个母鸡一生只能下一定数量的鸡蛋,下完了 ...
- 剑指offer十五之反转链表
一.题目 输入一个链表,反转链表后,输出链表的所有元素. 二.思路 详细分析见代码注释 三.代码 public class Solution { public ListNode Reverse ...
- Nutch抓取流程
nutch抓取流程注入起始url(inject).生成爬取列表(generate).爬取(fetch).解析网页内容(parse).更新url数据库(updatedb)1:注入起始url(inject ...
- ASP.NET Core 中使用 Hangfire 定时启动 Scrapyd 爬虫
用 Scrapy 做好的爬虫使用 Scrapyd 来管理发布启动等工作,每次手动执行也很繁琐;考虑可以使用 Hangfire 集成在 web 工程里. Scrapyd 中启动爬虫的请求如下: curl ...
- java+hibernate+mysql
实体类News package org.mythsky.hibernatedemo; import javax.persistence.*; @Entity @Table(name="new ...
- 一口一口吃掉Volley(二)
欢迎访问我的个人博客转发请注明出处:http://www.wensibo.top/2017/02/17/一口一口吃掉Volley(二)/ 相信看了第一篇教程之后,你应该会对Volley有一个初步的了解 ...
- Leetcode 746. Min Cost Climbing Stairs
思路:动态规划. class Solution { //不能对cost数组进行写操作,因为JAVA中参数是引用 public int minCostClimbingStairs(int[] cost) ...