\u2E80-\u2EFF:CJK部首补充: \u2F00-\u2FDF:康熙部首: \u3000-\u303F:CJK标点符号: \u31C0-\u31EF:CJK笔划: \u3200-\u32FF:CJK字母及月份: \u3300-\u33FF:CJK特殊符号(日期合并) \u3400-\u4DBF:CJK统一汉字扩展-A \u4DC0-\u4DFF:易经六十四卦象 \u4E00-\u9FBF:CJK(中日韩)统一表意字符 \uF900-\uFAFF: CJK 兼容象形文字 \uFE30-\…
[两种方法].net unicode汉字互相转换 ========================================= //汉字转Unicode编码(ASCII) private string StringToUnicode(string srcText) { string dst = ""; char[] src = srcText.ToCharArray(); ; i < src.Length; i++) { byte[] bytes = Encoding.Un…
在做 Windows app 的时候,与服务器端交互使用的是 json 格式的数据,里面的汉字内容被 编码成 unicode 格式,在调试的时候不太方便,就写了个工具,把里面的 unicode 内容转换成 汉字,方便调试.这个小工具是几个月前写的了,放在公司电脑的磁盘上,在其它地方使用时, 有点麻烦.就放到自己的博客里了. 这个工具很简单,运行截图: 1.在 xaml 页面中,放置两个 WebBrowser 控件,左侧用来显示 unicode 字符串,右侧显示转码后的结果.之所以使用浏览器控件,…
转自:http://blog.csdn.net/huangxy10/article/details/10012119 Unicode汉字编码表 1 Unicode编码表  Unicode只有一个字符集,中.日.韩的三种文字占用了Unicode中0x3000到0x9FFF的部分    Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制…
正则表达式匹配中文先要了解中文的编码 代码如下 复制代码 [u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符 [u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符 匹配中文字符的正则表达式: [u4e00-u9fa5]匹配双字节字符(包括汉字在内):[^x00-xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 代码如下 复制代码 String.prototype.len=function(){return this.replace([^…
一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8')) +row_l except: return None return None unicode中汉字为两字节, utf-8中汉字为三字节 https://en.wikipedia.org/wiki/Unicode https://en.wikipedia.org/wiki/UTF-8…
不定时增加正则表达式. 其中 Js验证写法: var str = "待验证文本"; var regular = new RegExp(/^这里是正则表达式/); if (regular.test(str)) { console.log("符合条件"); } else { console.log("不符合条件"); } Java验证写法:  (需要将\转义为\\) String str = "待验证文本"; String reg…
IP地址的正则表达式写法 这里讲的是IPv4的地址格式,总长度 32位=4段*8位,每段之间用.分割, 每段都是0-255之间的十进制数值. 将0-255用正则表达式表示,可以分成一下几块来分别考虑: 取值区间 特点 正则写法 可合并的写法 可合并的写法 可合并的写法 0-9 一位数,只有个位,取值是0~9 \d [1-9]?\d (1\d{2})|([1-9]?\d) (25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d))) 10-99 两位数,十位取值1-9,个位取值…
下载代码 --------------------------------------------------------------------------------- 虽然很笨的办法,却非常有效 --------------------------------------------------------------------------------- Pinyin.h ----------------------------------------------------------…
不用写正则表达式,用C#自带的方法 用char 自带的函数实现 /// <summary> /// 只能由数字和大小写字母组成 /// </summary> /// <param name="s"></param> /// <returns></returns> static bool StrongString(string s) { bool IsNum = false; bool IsUp = false; b…