C# 字符串知识整理
新知识点,只是对于本人来说而已。
- 系统处理文本的方式
【新知识点】.NET Framework
.NET Framework的定义:其包含了一个公共语言运行时(Common Language Runtime),和一个类库
其中有几个概念:
CLI公共语言基础结构(Common Language Interface):CLI定义了可执行代码和运行环境的规范。
运行环境:虚拟运行系统(Virtual Execution System,VES)。
CTS通用类型系统(Common Type System):CTS是CLI的核心。
C# 语言编译后的MSIL其实是CLR指令集。
托管堆:
CLR为应用程序预留了一块内存,此内存块就是托管堆,应用类型都存储在堆中。
【新知识点】Char类型的结构是Unicode字符,其中每个Unicode字符占2个字节(未使用代理对,代理对是有两对2个字节组成)。
【新知识点】值类型和应用类型的区别:值类型包括整型、枚举、字符和结构。引用类型包括类、接口、数组和字符串。对于值类型,编译器在编译的时候已经知道了其数据类型占的内存大小,所以把它分配到一个虚拟的栈中。对于引用类型,只有在运行该代码的时候才知道该类型占多大的内存,所以他需要动态分配,在托管堆中分配,在声明一个引用类型变量是,同时给它赋值了一个引用后,如要该变该变量的值,例如:Apple A= New Apple(); A=New Apple();
这里依次给A赋值了两次,其中,两个New Apple()是产生了两个新的引用。这就是处理字符串时候,string类型的性能限制所在。
【新知识点】在C#中char是有两个字节组成的,跟short的大小一样,是Unicode字符。string类型在存储中实质是char数组,所以string也是Unicode的。在内存中,一般在存储过程中,在第一位存string变量的长度,或者在最后一位新增一个0x00,标识字符串结束。
一些系统为了给字符串分配最小的内存空间,才有高速缓存模式,Microsoft才有BSTR(Binary String)二进制字符串。较长的字符串连接时,在堆分配时间时耗时比较长,这意味着,先连接长度较短的字符串能更好的利用性能。
【新知识点】内置:CLR会自动维护一个“内置池”。内置池的作用,当程序用同样的字符串初始化string变量的时候,CLR只会引用内置池的一个实例。不会在内存中重新分配一个地址。这有利于节省内存,要知道一般string类型的变量都是很大的。内置池是通过散列表实现的,检索内置池的时候是利用散列码,所以速度会很快。运行时创建的字符串,是不会自动内置的。我们可以使用String.Intern(s1),来检查字符串是否是内置的。
2.String类和StringBuilder类
【新知识点】在给一个string类赋新值或者连接的时候,性能损耗主要在两个地方:
内存的重新分配【引用类型】
字符串的复制
主要解决办法:减少字符串引用生成的时候,分配重新空间次数,所以在初始化的时候,预先分配更多的内存空间。【所以会存在内存的浪费】,这是BuilderString类的工作原理。
【新知识点】StringBuilder类有两个属性,一个是Length属性,一个是Capacity属性。Length是表示当前StringBuilder中字符串的长度,其不但可以设定,也可以获取。Capacity属性是表示当前StringBuilder中的容量大小。该容量会随字符串的变化而增大的。
【字符串优化操作技巧】推荐如下的操作技巧
尽量把字符串设置为常量,这样保证使用到内置池,同时最小化所需机器指令的数量。
如果String类能够有效的工作,就不要使用StringBuilder类。
如果要循环建立一个庞大的字符数据库,就使用StringBuilder。
如果需要国际化字符串,那么只能使用Compare()。否者使用CompareOrdinal()方法。
如果自诩知道字符串是否相同,那么就应该使用Equals(),而不是CompareOrdianl()方法。
通常情况下使用方法Equals,而不是“=”运算符。
3. 国际化
【新知识点】Unicode:在不同的国家或者地区中,不同的计算机中,使用不同的字符集,导致同一个字符有不一样的值。这增加了不同电脑之间数据转换的复杂度。为了解决这个问题,Unicode协会为世界上每个书面字符指定了一个位置值。一开始的时候,Unicode编码是有两个字节组成的,能表示65000多个字符,但是不能表示全部的字符。后来发明了一种代理对的东西,使用两对两字节的内存来表示一个字符。
【新知识点】字符中的文化,在全世界中,表示同一种东西有很多不同的符号,例如表示100000元的时候,中国和美国就有如下两种表示方法,系统是根据你自己的PC上设定的字符集来知道其表示形式的。其中有关的一个类就是CultureInfo类。
【新知识点】文化的分类:
不变文化:是一种完全不去文化的文化,很多系统进程需要独立于文化,就是说,该文化下的字符与文化无关。
中立文化:该文化与语言有关,与地区无关。
具体文化:该文化与语言和国家地区相关。中立文化和具体文化的主要区别在于后者提供了具体地区或者国家的相关日期、时间、货币、和数字格式选项的附加信息。
【新知识点】文化在程序中的应用:
CurrentUICulture的值决定了如何加载一个窗体资源。可以是中立文化。
CurrentCulture的值决定了其他方面—日期格式、数字格式、字符串大小写和比较等等。必须是具体文化。
int money = 100000;
Console.WriteLine(money.ToString("C"));
Thread.CurrentThread.CurrentCulture=new CultureInfo("en-US"); //具体文化
Console.WriteLine(money.ToString("C"));
【新知识点】文化与比较
在字符串比较中,可以区分文化和不区分文化。如果不区分文化,那么就按照Unicode码来比较,如果区分文化,那么就按照当前的文化来比较。
对于
string a = "ciao";
string b = "character";
不区分文化的话,明显是a>b。
string a = "ciao";
string b = "character";
if (string.Compare(a, b,true, new CultureInfo("cs-CZ")) < 0)
Console.Write("b>a");
如果当前文化是捷克语的话,那么b>a。
String.CompareOrdinal()是不区分文化的比较。
String.Compare()是区分文化的比较。
String.Equals()也是不区分文化的比较。网上说是非安全的比较,所以速度最快。
C# 字符串知识整理的更多相关文章
- js事件(Event)知识整理
事件(Event)知识整理,本文由网上资料整理而来,需要的朋友可以参考下 鼠标事件 鼠标移动到目标元素上的那一刻,首先触发mouseover 之后如果光标继续在元素上移动,则不断触发mousemo ...
- Kali Linux渗透基础知识整理(二)漏洞扫描
Kali Linux渗透基础知识整理系列文章回顾 漏洞扫描 网络流量 Nmap Hping3 Nessus whatweb DirBuster joomscan WPScan 网络流量 网络流量就是网 ...
- js事件(Event)知识整理[转]
事件注册 平常我们绑定事件的时候用dom.onxxxx=function(){}的形式 这种方式是给元素的onxxxx属性赋值,只能绑定有一个处理句柄. 但很多时候我们需要绑定多个处理句柄到一个事件上 ...
- Javascript语言精粹之正则表达式知识整理
Javascript语言精粹之正则表达式知识整理 1.正则表达式思维导图 2.正则表达式常用示例 2.1 移除所有标签,只留下innerText var html = "<p>& ...
- ES6知识整理(4)--数组的扩展
最近工作比较忙,基本每天都会加班到很晚.处理一些客户端兼容问题以及提升用户体验的优化.也将近一周没更文了,现在继续es6的学习总结. 上篇回顾 ES6知识整理(三)--函数的扩展 扩展运算符 形式是3 ...
- Linux基础-shell脚本知识整理和脚本编写----------变量、运算符、流程控制、函数、计划任务(发送邮件)
I:知识整理:变量.运算符.流程控制.函数.计划任务 变量 系统变量:set:显示所有变量 env:环境变量 常用系统变量: path pwd lang home his ...
- C++进阶4.C++知识整理
C++知识整理(多益笔试) 20131012 前言: 还是关于笔试知识的整理,主要是面向对象的知识还有一些常见的语法知识. 1.还是C++内存管理的知识 C++中程序的内存分布如下: 栈:向下增长,可 ...
- MySQL 索引知识整理(创建高性能的索引)
前言: 索引优化应该是对查询性能优化的最有效的手段了.索引能够轻易将查询性能提高几个数量级. // 固态硬盘驱动器有和机械硬盘启动器,有着完全不同的性能特性: 然而即使是固态硬盘,索引的原则依然成立, ...
- Redis相关知识整理
Redis相关知识整理 1. Redis和MySQL的区别?a).mysql是关系型数据库,而redis是NOSQL,非关系型数据库.mysql将数据持久化到硬盘,读取数据慢,而redis数据先存储在 ...
随机推荐
- Oracle语句集锦
创建用户并赋予dba权限 1)进入cmd 2)sqlplus / as sysdba 或者 sqlplus sys/密码 as sysdba SQL> conn sys/wcq123@orcl ...
- viewpager与子view的事件冲突解决
问题: 对android的事件机制一直不怎么了解,最近android项目中运用viewpager+listview (就是viewpager的子view中嵌套了listview),出现了触摸手势冲突 ...
- KSImageNamed-Xcode
KSImageNamed-Xcode 非常的给力的XCODE图片浏览插件; What is this? Can't remember whether that image you just add ...
- C++传递函数指针
函数指针是一个很好的类型.因此,您可以编写一个函数,它的一个参数是一个函数指针.然后.在(外部)当函数使用的函数指针参数,来间接调用时调用相应的参数的函数的函数. 因为指针在不同的情况下能够指向不同的 ...
- jQuery中间each实施例的方法
$.each()和$(selector).each()很阶段似,但它是不一样的. 前者可用于遍历数组或json对象 后者被设计成遍历jQuery对象 第一个是$.each()对,通常这么用 $.eac ...
- Git使用摘要
svn过渡到git流程.使用我一直git svn场景,对于遇到的一些问题,并经常使用的功能来概括: 1.git svn出口: git svn clone "svn通路" 2.git ...
- 解决SMARTFORMS 中table 控件单行跨页的问题
在CX项目中,MM模块做了大量的的单据打印的工作,一个问题困扰了我好久,一直不能解决.当物料描述很长时,table控件在单元格中能自动换行,这样就有可能在换页处出现一行记录的一部分打在上一页,一部分记 ...
- WPF3D学习,立方体的绘制
原文:WPF3D学习,立方体的绘制 以此为一个好的开始吧!一直都太懒,坚持写文章是个不错的开始!碰巧最近在研究WPF3D这块的知识,也为了练练自己的写作水平,整理这篇文章.新手上路,多多关照! 本文先 ...
- selinux 工具下载地址
http://userspace.selinuxproject.org/releases/ 里面包含了 Name Last modified Size Description Parent Direc ...
- 高质量c c++编程
第1章 文件结构 每一个C++/C程序通常分为两个文件.一个文件用于保存程序的声明(declaration),称为头文件.还有一个文件用于保存程序的实现(implementation),称为定义(de ...