Char

C#里面的char,其实就是System.Char类型的别名,它代表一个Unicode字符(是这样吗?),占用两个字节。

例如:char c = ‘A’;

char占用两个字节,也就是16位,其实本质上char其实就是16位的无符号整型数值,范围是0到65535,也就是和无符号short的范围是一样的。

转义字符

有一些字符无法通过字面的意思来进行解释,这时候就可以使用转义字符。

转义字符是以 / 开始,后边跟着一个有特殊意义的字符。

例如:

char newLine = '\n'; 这个表示换行

char backSlash = '\\'; 这个就表示 \

转义字符的列表如下:

还有\u(\x)这两个转义字符可以让你通过4位16进制的形式来表示任意的Unicode字符,例如:

char copyrightSymbol = '\u00A9'; // ©
char omegaSymbol = '\u03A9'; // Ω
char newLine = '\u000A'; // 换行

转换

char类型的变量可以隐式的转换到可容纳无符号short类型的数值类型,例如:

字符扩展

char只能代表一个Unicode字符, 其实这句话不太准确。

我们知道Unicode里 65 代表着字母 A,但其实65是A的Unicode代码点,通常是这样来表示的 U+0041,16进制的41就是10进制的65。

而看这个例子,德语里面有个字符:ß,它的UniCode是 U+00DF,但就其本身而言,ß 不是一个字母,ß被认为等价于ss(也就是两个s),例如fußball就相当于fussball。

而用在字符/字符串比较的时候,就不可以把ß当作一个字符来处理,而是把ß=ss。

而ß所对应的U+00DF这个代码点就是字符扩展(Character expansion)的一个例子,如果想正确的比较字符/串,那么这个代码点就必须先转化为其它的多个代码点,这里就是 U+00DF -> U+0073 + U+0073,也就是ß -> ss,记住,这只是用于比较,而不是展示。

字符代理

字符代理(char surrogates),和字符扩展正好相反。

字符扩展是指,一个字符代表了多个实际的字符而字符代理呢,就是使用两个char的实例来表示一个实际的字符

字符代理之所以存在,是因为它的范围太小了(0-65535),所以根本无法代表世界上这么多语言的字符。实际上Unicode的代码点是从0到1114111(0x10FFFF),所以16位的存储远远不够用。

正是因为这点,Unicode UTF16有一个可以表示所有字符的体系,就是使用两个连续的16位数值来表示,这就叫做代理对(surrogate pairs)。

在这两个连续的16位数值里,第一个数的范围是U+D800到U+DBFF(55296到56319),所以如果您在解析字符/串的时候,解析出来的数值正好落在这个范围里,那么你就需要把这个char和它后边的char连在一起进行解析,才能得出真正要表示的字符。

从术语上讲,第一个16位数叫做High Surrogate(高代理项),第二个数叫做Low Surrogate(低代理项)。

例如:

C# - char类型的一些介绍的更多相关文章

  1. OCCI处理CHAR类型字符串变量的不同

    问题背景: 一个旧应用,原先应用是用proc写的,9i的库,如今应用须要改为使用OCCI,当中有一段查询逻辑:select ... where upper(state)=upper(:1). (此处请 ...

  2. C++中char类型的溢出问题

    C++中什么经常会运用到char类型,也会将char类型作为循环语句的循环条件,但往往这里最容易出现错误,容易出现溢出,进入死循环.这里我们就来简单介绍下为什么会出现这种情况. 首先,了解下char类 ...

  3. char类型的数值转换

    在视频教程中,你已经认识到了数字类型之间.字符串和其他类型之间的转换.而某些时候,我们还需要将char类型转换为int类型,或者把int类型转换为char类型. 这篇文章,将介绍在代码中虽然不太常用, ...

  4. C语言基础(6)-char类型

    1. char常量.变量 使用单引号‘’引起来的就是char的常量 ‘a’是一个char类型的常量 “a”是一个字符串类型的常量 1是一个int型的常量 ‘1’是一个char型的常量 char a; ...

  5. 在vs中char类型的实参与LPCWSTR类型的形参类型不兼容怎么解决?

    今天在做 COS脚本解释器的时候,遇到了这个问题 先了解一下 LPCTCHAR 这个东东 LPCTSTR用来表示你的字符是否使用UNICODE, 如果你的程序定义了UNICODE或者其他相关的宏,那么 ...

  6. 关于各种类型数据char、int、double、float 所占空间长度的计算,而char类型让我长姿势了

    #include <iostream> int main() { using namespace std; //int A=10; //double B=6; cout << ...

  7. unsigned char 类型

    在蓝牙4.0的开发中,很多数据类型都用到了 unsigned char ,我觉得用这个类型的一个原因是相比较于整型,它占的空间更少. 比如: unsigned char a = 1;  // 占1个字 ...

  8. char类型输出地址

    问题描述: 当输出char的地址时,发现输出的是一个字符: char ch = 'a'; cout<<&ch<<endl;//a @ 因为cout得到一个char类型的 ...

  9. char类型的说明

    CREATE TABLE [dbo].[CharTest]( ) NULL, ) NULL, ) NULL, ) NULL ) insert into dbo.CharTest ( Char, Var ...

随机推荐

  1. App开发流程之iOS开发证书拾遗

    很久没有总结,回头看了一下过期的账号,记录的内容少之又少.最近有一些时间,想好好总结记录一下. 由于很久没有记录,想写的东西很多又很杂,想了一下,一篇一篇罗列知识点和经验,还不如写一个系列,记录一个应 ...

  2. Spark- Transformation实战

    RDD的算子分为两类,是 Trans formation(Lazy),一类是 Action(触发任务执行RDD不存在真正要计算的数据,而是记录了RDD的转换关系(调用了什么方法,传入什么函数) RDD ...

  3. 在windows下进行linux开发:利用Vagrant+virtualbox

    1,介绍Vagrant 我们做web开发的时候经常要安装各种本地测试环境,比如apache,php,mysql,redis等等.出于个人使用习惯,可能我们还是比较习惯用windows.虽然说在wind ...

  4. Hibernate学习---第七节:关联关系

    一.关联关系一对一外键(双向) 1.实体类,代码如下: package learn.hibernate.bean; import java.util.Date; /** * 持久化类设计 * 注意: ...

  5. HTML5中Modernizr类库的作用和使用

    Modernizr 是一个用来检测浏览器功能支持情况的JavaScript 库.通过这个库我们可以检测不同的浏览器对于HTML5特性的支持情况. 使用Modernizr类库和使用其他第三方类库的方法是 ...

  6. jenkins-小知识点

    如果想停止jenkins运行 控制面板-服务-查看本地服务-选中jenkins 1.启动类型改为手动 2.改为禁止 使用的时候,每次都改一下状态

  7. Convolutional Neural Networks for Visual Recognition 5

    Setting up the data and the model 前面我们介绍了一个神经元的模型,通过一个激励函数将高维的输入域权值的点积转化为一个单一的输出,而神经网络就是将神经元排列到每一层,形 ...

  8. 将session存入数据库,memcache的方法

    //存入数据库 <?phpif(!$con = mysql_connect('localhost','root','123456')){    die('连接数据库失败');}$link = m ...

  9. BZOJ5323 JXOI2018 游戏

    传送门 这是我见过的为数不多的良心九怜题之一. 题目大意 有一堆屋子,编号为$l,l+1...r-1,r$,你每次会走入一个没走入过的房子,然后这个房子以及编号为这个房子编号的倍数的房子就会被自动标记 ...

  10. CF221C Circling Round Treasures

    题目大意 给定一个$n\times m$的网格$(n,m\leq 20)$,每个格子都是$S\space \#\space B\space x\space .$中第一个. $S$表示起点,保证有且仅有 ...