正则表达式——Unicode 属性列表
7.7.1 Unicode Property
每个 Unicode 字符都只能属于一个 Unicode Property。所有的 Unicode Property 共分为7大类,30小类。大类的名字只有1个字母,小类的名字则不知1个字母,开头字母与所在大类的名字相同,小类包含的字符都属于它所在的大类。
.tg {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-s268{text-align:left}
.tg .tg-0lax{text-align:left;vertical-align:top}
| Unicode Property | 说明 | |
|---|---|---|
| \p{C} | 不可见的控制字符和未使用的码值 | |
| \p{Cc} | ASCII 编码中 0x00 到 0x1F 或 Latin-1 编码中 0x80 到 0x9F 的控 制字符 |
|
| \p{Cf} | 不可见的格式字符 | |
| \p{Co} | 留作私用的码值 | |
| \p{Cs} | UTF-16 编码中 surrogate pair 的一半 | |
| \p{Cn} | 未指定的码值 | |
| \p{L} | 各种语言中的字母 | |
| \p{Ll} | 具有大写形式的字母的小写形式 | |
| \p{Lt} | 只有在单词首位才大写的字符 | |
| \p{L&} | 等于Ll、Lu、Lt的组合 | |
| \p{Lo} | 没有大小写形态的字母 | |
| \p{Lu} | 具有小写字母的字母的大写形式 | |
| \p{M} | 用来与其他字符结合的字符(声调、元音变化音等) | |
| ">\p{Mc} | 与其他字符组合,并且会占用空间的字符(常见于东亚语言) | |
| \p{Me} | 需要成对出现的字符,比如圆括号、方括号 | |
| \p{Mn} | 用来与其他字符结合,但并不占用额外空间的字符 | |
| \p{N} | 各种书写系统中的数字字符 | |
| \p{Nd} | 各种书写系统中的 0~9 的字符 | |
| \p{Nl} | 形如字符的数字,比如罗马数字 | |
| \p{No} | 上标或者下标数字,或者是0~9之外的数字(不包括表一书写系 统中的数字) |
|
| \p{P} | 各种标点符号 | |
| \p{Pd} | 各种连字符号 | |
| \p{Ps} | 成对但不同的符号的前半部分(包括英文括号、中文括号、书名号) | |
| \p{Pe} | 成对但不同的符号的后半部分(包括英文括号、中文括号、书名号) | |
| \p{Pi} | 成对但不同的符号的前半部分(比如单引号、双引号) | |
| \p{Pf} | 成对但不同的符号的后半部分(比如单引号、双引号) | |
| \p{Pc} | 类似下划线之类的标点字符 | |
| \p{Po} | 除横线、括号、引号和连接符之外的任何标点符号 | |
| \p{S} | 数字符号、货币符号 | |
| \p{Sm} | 数字符号 | |
| \p{Sc} | 货币符号 | |
| \p{Sk} | 由多个字符构成的组合字符 | |
| \p{So} | 数字符号、货币符号和组合字符之外的符号字符 | |
| \p{Z} | 空白字符,或者不可见的字符 | |
| \p{Zs} | 不可见但占用空间的空白字符 | |
| \p{Zl} | 分行符 U+2028 | |
| \p{Zp} | 分段符 U+2029 | |
7.7.1 Unicode Block
每个 Unicode Block 都对应一个连续的 Unicode 码值区间,U+0000 到U+FFFF 之间的字符一共划分为 105 个 Block。
使用时应该注意,Java 使用的 Unicode Block 是\p{In...}形式的,比如InCJK_Unified_Ideographs;而 .NET 使用的 Unicode Block 是\p{Is...}形式的,同时不包含下划线,比如IsCJKUnifiedIdeographs。







正则表达式——Unicode 属性列表的更多相关文章
- 正则表达式——Unicode 属性
每一个 Unicode 字符,除了有 Code Point 与之对应外,还具体其他属性,在正则表达式中常用到三种 Unicode 属性: Unicode Property.Unicode Scri ...
- 正则表达式通过Unicode属性匹配
原文链接:http://zochen.iteye.com/blog/690716 Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类. \pP 其中的小写 p 是 prop ...
- 利用Unicode属性移除文本中的标点符号
原文:http://bbs.csdn.net/topics/270033191 摘抄: str = str.replaceAll("[\\pP‘’“”]", "&qu ...
- Struts2 contentType属性列表
Struts2 contentType属性列表 博客分类: Struts 2 'ez' => 'application/andrew-inset', 'hqx' => 'applica ...
- iOS 应用数据存储方式(XML属性列表-plist)
iOS 应用数据存储方式(XML属性列表-plist) 一.ios应用常用的数据存储方式 1.plist(XML属性列表归档) 2.偏好设置 3.NSKeydeArchiver归档(存储自定义对象) ...
- iOS开发备忘录:属性列表文件数据持久化
属性列表文件是一种XML文件,Foundation框架中的数组和字典等都可以于属性列表文件相互转换. NSArray类常用读写属性列表文件的方法: +arrayWithContentsOfFile:类 ...
- iOS-数据持久化-属性列表
属性列表 属性列表文件是一种XML文件,Foundation框架中的数组和字典等都可以于属性列表文件相互转换. NSArray类常用读写属性列表文件的方法: +arrayWithContentsOfF ...
- Unicode字符列表(超完整)
Unicode字符列表(超完整)Unicode, 字符, 列表代码 显示 描述U+0020 空格 U+0021 ! 叹号 U+0022 " 双引号 U+0023 # 井号 U+0024 $ ...
- iOS开发UI篇—ios应用数据存储方式(XML属性列表-plist)
iOS开发UI篇—ios应用数据存储方式(XML属性列表-plist) 一.ios应用常用的数据存储方式 1.plist(XML属性列表归档) 2.偏好设置 3.NSKeydeArchiver归档(存 ...
随机推荐
- (转) linux实现ssh免密码登录的正确方法
方法/步骤 验证ssh远程登录,未作免密处理的两台机器,登录时,是需要输入密码的 本地系统执行 ssh-keygen -t rsa 命令,生成密钥文件 在相应的目录下查看生成的密钥文件,其中:id_r ...
- Web Api 接口测试工具:Swagger
前言:WebApi接口开发完毕后,交付给前端人员或手机端开发者时接口说明文档是必不可少的配套设备,如果公司流程不规范大家使用口口相传的交接方式,而且没有改进的欲望,那你可以到此为止了.Swagger是 ...
- controller 有两种写法,讨论一下两种写法的区别:
controller 有两种写法,讨论一下两种写法的区别: 写法 1: app.controller('myCtrl', function($scope, $location) { $scope.my ...
- Bootstarp-table入门(1)
https://blog.csdn.net/dlf123321/article/details/52231926?locationNum=11&fps=1
- 解决jmeter 请求参数中文乱码
今天在用jmeter 写脚本时发现查看结果树request post请求中文参数值是乱码,故记录下解决过程. 解决过程如下: 1.修改本地配置文件 因为此处的数据,还没有发送出去,所以,肯定是这个变量 ...
- 【NOIP2012模拟10.25】单元格
题目 在一个R行C列的表格里,我们要选出3个不同的单元格.但要满足如下的两个条件: (1)选中的任意两个单元格都不在同一行. (2)选中的任意两个单元格都不在同一列. 假设我们选中的单元格分别是:A, ...
- c++ copy和operator =
目录(?)[+] 构造函数 拷贝构造函数 赋值函数 C++中一般创建对象,拷贝或赋值的方式有构造函数,拷贝构造函数,赋值函数这三种方法.下面就详细比较下三者之间的区别以及它们的具体实现 1.构造函 ...
- React native 之 async/await
参考资料 :https://www.jianshu.com/p/1e75bd387aa0 要点: 1. async function(){} 将普通函数转换成Promise 2. await 表达式/ ...
- YOLO_V2
YOLOv2:代表着目前业界最先进物体检测的水平,它的速度要快过其他检测系统(FasterR-CNN,ResNet,SSD),使用者可以在它的速度与精确度之间进行权衡. YOLO9000:这一网络结构 ...
- Django基础之二(URL路由)
URL路由 简介 对于高质量的web应用来说,使用简洁,优雅的URL路由是一个值得尊重的细节,Django可以随心所欲的设计URL,不受框架的约束 为了给一个应用设计URL,你需要一个Python模块 ...