Unicode控制字符
Unicode控制字符就是特殊的Unicode字符
控制字符转义代码对照表
Unicode-控制字符
LRM
RLM
ZWJ
ZWNJ
LRE
LRO
RLO
NADS
NODS
ASSⁱ
ISS⁰
AAFS
IAFS
RS
US
当然,也可以用16进制表示,如让文本实现反向排列的RLO对应的等同于 让前面运算法则结束的字符PDF是等于
左到右标记 (LRM)
操作时很象从左到右字符,只是它不显示。LRM 没有任何其它语义效果。
从右到左标记 (RLM)
操作时很象从右到左字符,只是它不显示。RLM 没有任何其它语义效果。
零宽度联接器 (ZWJ)
防止连续字符在输出上联接。
零宽度非联接器 (ZWNJ)
在两个字符间添加非联接器,防止这两个字符在映射时连接草率。
启动从左到右的嵌套 (LRE)
表示将从左到右嵌套一些文本。例如, 阿拉伯句子中间的英文引用语可被标记为从左到右的嵌套文本。(LRE 影响单词顺序,不影响字符顺序。)
启动从右到左的嵌套 (RLE)
表示将从右到左嵌套一些文本。例如,英语引用语中间的希伯来短语可被标记为从右到左的嵌套文本。(RLE 影响单词顺序,不影响字符顺序。)
启动从左到右的优先 (LRO)
当需要用于特殊情况(例如,用于部件编号)时,优先于双向字符类型。LRO 强制字符成为从左到右的字符。
启动从右到左的优先 (RLO)
当需要用于特殊情况(例如,用于部件编号)时,优先于双向字符类型。RLO 强制字符成为从右到左的字符。
直接格式化 (PDF)
终止上一个显式代码的效果(嵌套或优先),并将双向状态恢复到在上一个 LRE、RLE、RLO 或 LRO 控制字符之前的状态。
国家(地区)数字形状替代 (NADS)
使用国家(地区)数字形状显示 U+0030-U+0039(ASCII 数字)。国家(地区)数字形状由当前用户的区域设置决定。
名义(欧洲)数字形状 (NODS)
使用名义数字形状显示 U+0030-U+0039(ASCII 数字)。名义数字形状是欧洲数字。
激活对称交换 (ASS)
表示是否应该将成对的字符名中的 LEFT 或 RIGHT 分别解释为有意义的打开或关闭。(默认状态是激活。)
禁止对称交换 (ISS)
关闭象圆括号这样的字符的对称交换,这样其左边和右边能继续表明向左和向右的朝向,与打开对称交换时的打开和关闭状态相反。
激活阿拉伯成形 (AAFS)
控制阿拉伯兼容性字符的成形行为。在显示过程中,某些字母形式可能以草率的连接或者连字狐线的方式联接起来。成形选择器代码表示用于获得显示效果的字符形状确定(glyph 选择)过程是处于激活还是禁止状态。(默认状态为禁止。)
禁止阿拉伯成形 (IAFS)
禁止字符成形确定过程, 这样字符不会根据位置而成形。
记录分隔符(块分隔符) (RS)
在每个行分隔符后开始新的行。
US Unit Separator (Segment Separator)
每个段分隔符后开始新的段。
Unicode控制字符的更多相关文章
- Ansi,UTF8,Unicode,ASCII编码的差别
近日须要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了,以下全是从网上搜来的: 1. ASCII和Ansi编码 字符内码(charcter code)指的是用来代表字符的内 ...
- Ansi,UTF8,Unicode,ASCII编码的区别 ---我看完了 明白了很多
来自:http://blog.csdn.net/xiongxiao/article/details/3741731 ------------------------------------------ ...
- 小技巧:unicode RLO
unicode 控制字符 RLO 可以将位于其后的文字翻转. 于是可以被病毒利用. 如图 重命名文件,在gpj前插入unicode RLO,之后若不小心,可能会被欺骗,误以为是jpg文件. 如果修改程 ...
- unicode编码原理及问题
历史在1963年,计算机的使用尚不广泛,那时使用的是7-bit的ASCII码,范围为0-127作为字符的编码,只支持少部分的字符,但是随着计算机的普及,不同的国家地区开始自己制造自己的编码规范,这导致 ...
- Ansi,UTF8,Unicode,ASCII编码的区别
Ansi,UTF8,Unicode,ASCII编码的区别 近日需要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了, 下面全是从网上搜来的: 1. ASCII和Ansi编码 ...
- Pdf File Writer 中文应用(PDF文件编写器C#类库)
该文由小居工作室(QQ:2482052910) 翻译并提供解答支持,原文地址:Pdf File Writer 中文应用(PDF文件编写器C#类库):http://www.cnblogs.com/ ...
- 如何将Windows电脑桌面上软件图标下的文字去掉
如何将Windows电脑桌面上软件图标下的文字去掉 重命名的时候,点击鼠标右键.选择“插入Unicode控制字符” 效果
- Go语言中多字节字符的处理
1 概述 Go语言的字符串是使用 UTF-8 编码的.UTF-8 是 Unicode 的实现方式之一.本文内容包括:UTF-8 和 Unicode 的关系,Go语言提供的 unicode 包和 uni ...
- Team Foundation 中的错误和事件消息
Visual Studio Team System Team Foundation 中的错误和事件消息 Team Foundation 通过显示错误消息和事件消息来通知您操作成功以及操作失败.一部分错 ...
随机推荐
- ORACLE_TRIGGER
PL/SQL TRIGGER Statement PL/SQL TRIGGER Statement The trigger statemet is a especially stored proce ...
- 6 - 常用模块(os,sys,time&datetime,random,json&picle,shelve,hashlib)
导入模块 想使用 Python 源文件,只需在另一个源文件里执行 import 语句 import module1[, module2[,... moduleN] from语句让你从模块中导入一个指定 ...
- python接口测试-项目实践(五) 实际结果与预期结果对比之 接口对比
五 与开发接口对比 1 分别将三个接口封装成三个函数,传入接口参数,返回提取并处理后的各字段. 拼接字符串作为单独的函数. def api_1(code): 发送请求获取响应 提取响应数据 响应数据转 ...
- python 带BOM头utf-8的响应解码
接口响应编码格式为带BOM头utf-8.直接获取响应的text出现乱码. '''dinghanhua2018-11requests text与content,指定响应的encoding''' api ...
- 抓取android系统日志_记录一次定位app闪退故障
在测试android客户端兼容性时,发现app闪退,上海的小伙伴需要闪退时的系统日志:故把快生锈的adb知识拿出来show一把: 1.下载adb工具包(adb的全称为Android Debug Bri ...
- Ubuntu下Qt(Retex)无法输入中文
这个问题从我第一次在Ubuntu上使用Qt便困扰着我,奈何之前一直没认真去解决掉这个问题.今天作死想想,这个不可能解决不掉的.因为那么多人用Ubuntu,而且又那么多人用Qt的产品,比如Retext. ...
- H5中的微信支付、支付宝支付
微信支付的申请: 公众号支付.扫码支付等在微信公众平台.移动端的申请在微信开放平台 公众号支付流程:申请微信公众号(服务号并完成微信认证)——申请微信支付商户号(申请微信支付,资料审核通过以后,请前往 ...
- shell命令查看某文件夹下的文件个数
shell命令查看某文件夹下的文件个数 2010-06-25 17:05:15| 分类: shell |字号 订阅 1.查看某文件夹下文件的个数: ls -l |grep "^-&qu ...
- papers-06-02
午睡被同事吵醒,只好干活.看到微信公众号有一篇文章说老朋友呢,点进去发现原来相关的工作好多,而且好新好细致. 微信的文章可以见这里: 探究最陌生的老朋友Softmax 里面的几篇文章可以看看. Lar ...
- 第一次写C语言小程序,可以初步理解学生成绩管理系统的概念
1 成绩管理系统概述 1.1 管理信息系统的概念 管理信息系统(Management Information Systems,简称MIS),是一个不断发展的新型学科,MIS的定义随着科技的进步也在 ...