Unicode不可见字符的显示

~雨落忧伤~ 2024-10-31 20:33:27 原文

Unicode的学名是”Universal Multiple-Octet Coded Character Set”，简称为UCS

不可见字符”/u200b”为 Unicode Character ‘ZERO WIDTH SPACE’ (U+200B)，可用于内容标识，不占位数。

echo $LANG可以显示出Linux 系统的编码方式，一般默认为UTF-8。
在Linux终端中”/u200b”为不可见字符。为了显示出内容中加入的不可见字符，可将内容保存到文本中，利用less命令打开文本。

less

1	`less 与 more 类似，但使用 less 可以随意前后浏览文件，而 more 仅能向前移动，却不能向后移动，而且 less 在查看之前不会加载整个文件。`

eg:

1

2

3

4

5

在查看日志时

grep xxxxxx info.log |less

以less分页显示的形式查看日志，用less打开的日志可以展示出不可见字符

less info.log |grep xxxxxx

打开的日志无法展示出不可见字符

java中打印unicode的例子

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

import static org.assertj.core.api.Assertions.assertThat;

/**

* Created by wenjia3 on 16/12/1.

*/

public class unicode {

public static void main(String[] args){

String contentOri="test unicode";

String content1="\u200b" + contentOri + "\u200b" ;

String content2="\u0021" + contentOri + "\u0021";

String str = "";

for (int i = 0; i < content1.length(); i++) {

int ch = (int) content1.charAt(i);

if (ch == '\u200b')

str += content1.charAt(i) + "\\u" + Integer.toHexString(ch);

else

str += content1.charAt(i);

}

System.out.println(content1);

System.out.println(content2);

System.out.println(str);

assertThat(content1).as("不含有／U200B字符").contains("\u200b");

}

}

运行结果

1

2

3

?test unicode?

!test unicode! ?

\u200btest unicode?\u200b

直接打印content1、content2，unicode字符会自动编译成当前标准输出的编码。即\u200b为不可见字符，\u0021为“！”。
可以利用charAt()在程序中进行转换，将字符的unicode值打印出来。

Unicode不可见字符的显示的更多相关文章

decode_json 必须是unicode形式的字符
centos6.5:/root/test#cat a1.pl use JSON qw/encode_json decode_json/; use Encode; my $data = [ { 'nam ...
[c/c++] programming之路（25）、字符串（六）——memset，Unicode及宽字符，strset
一.memset #include<stdio.h> #include<stdlib.h> #include<memory.h> void *mymemset(vo ...
unicode 和 utf-8字符编码的区别
作者:于洋链接:https://www.zhihu.com/question/23374078/answer/69732605来源:知乎著作权归作者所有,转载请联系作者获得授权. 原文:unico ...
正则表达式入门（六）匹配unicode和其他字符
匹配unicode字符有时候我们需要匹配ASCII范围之外的字符. "Qu'est-ce que la tolérance? c'est l'apanage de l'humanité. N ...
cocos2d-x CCEditBox 字符不能显示完全的bug
cocos2d-x CCEditBox 字符不能显示完全的bug (cocos2dx版本 2.2.0)用CCEditBox制作帐号输入框,当输入的内容超过框的宽度时,框里面不会显示当前输入的字符,显示 ...
unicode编码、字符的转换和得到汉字的区位码
一:unicode编码.字符的转换截图二:unicode编码.字符的转换代码 using System; using System.Collections.Generic; using System ...
刨根究底字符编码之十——Unicode字符集的字符编码方式CEF
Unicode字符集的字符编码方式CEF 一.字符编码方式CEF的选择 1. 由于Unicode字符集非常大,有些字符的编号(码点值)需要两个或两个以上字节来表示,而要对这样的编号进行编码,也必须使用 ...
[Word]让字符重合显示
某些时候需要让字符重合显示,比如您好二字,显示为: 需要用到word的Advance域,他可以让后面的文字上下左右移动一定的磅. 譬如上面你好的显示:word中域代码为: 意思是好字向left移动了2 ...
【转】javascript和html中unicode编码和字符转义的详解
不是十分理解unicode和html转义的情况下,可能会误用,所以下面会对它们再做比较容易理解的解释: 1.html中的转义:在html中如果遇到转义字符(如“ ”),不管你的页面字符编码是utf-8 ...

随机推荐

leetcode486 Predict the Winner
思路: 博弈. 实现: class Solution { public: bool PredictTheWinner(vector<int>& nums) { ][]; int n ...
Python 将中文转拼音
文字转拼音 import os.path class PinYin(object): def __init__(self): self.word_dict = {} def load_word(sel ...
TCP/IP和UDP的比较
TCP.UDP详解 1.传输层存在的必要性由于网络层的分组传输是不可靠的,无法了解数据到达终点的时间,无法了解数据未达终点的状态.因此有必要增强网络层提供服务的服务质量. 2.引入传输层的原因面向 ...
RPC——笔记
整理的笔记来源:https://mp.weixin.qq.com/s/JkXrPcuKtE2qYgmDcH2uww RPC(远程过程调用): RPC是:一个计算机通信协议. 调用过程:计算机 A 上的 ...
MyEclipse 快捷键大全(@Hcy)
MyEclipse 快捷键1(CTRL)-------------------------------------Ctrl+1 快速修复Ctrl+D: 删除当前行 Ctrl+Q 定位到最后编辑的地方 ...
VR虚拟红包的技术实现
2017年1月20日,腾讯发布消息称将推出Q-Glass,除了一般VR眼镜的标配功能外,Q-Glass还能实现眨眼抢红包.听起来是不是很酷炫?上市时间可要在10年后.不过,2016年底支付宝首推AR实 ...
js判断是安卓还是 ios webview？
通过判断浏览器的userAgent,用正则来判断是否是ios和Android客户端.代码如下: <script type="text/javascript"> var ...
map 用法
map 是一种关联容器, 提供一对一的关联, 关联的形式为: KEY----VALUE 关键字不重复.multimap与map类似,但是允许关键字重复即:关键字和与之对应的值关键字起到索 ...
A2. JVM 类加载机制
[概述] 虚拟机把描述类的数据从 Class 文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的 Java 类型,这就是虚拟机的类加载机制. 与那些在编译时需要进行连接 ...
[Algorithm] 6. Merge Two Sorted Arrays
Description Merge two given sorted integer array A and B into a new sorted integer array. Example A= ...