深入学习系列--Data Structure--02字符串
字符串可以说是我们实际工作中使用最多的数据类型了,常见的字符串操作包括链接、取子串、格式化等。这部分内容总体来说比较容易理解,最难的部分要数字符串的模式匹配方法了,尤其是KMP算法,需要通过实践加以记忆。
串的定义:是由零个或者多个字符组成的有限序列,又叫字符串。串的比较是通过其编码的顺序进行的(对于ASCII码来说,其通过7个二进制表示一个字符,共可以表示128个字符),通常来说,对于给定的两个字符串s=a1a2…an,t=b1b2…bm来说,如果n<m且ai=bi(i=1,2…n),那么有s<t;如果存在某个k<=min(m,n),使得ai=bi(i=1,2…k-1),ak<bk,则s<t。接下来通过一个表格来了解串的常见操作(用C#自定义字符串类实现)。
操作 |
诠释 |
StrAssign(T, *chars) |
生成一个其值等于字符串常量chars的串T |
StrCopy(T,S) |
串S存在,由串S复制得到T |
ClearString(S) |
若S存在,将串清空 |
StringEmpty(S) |
若S存在,返回true,否则返回false |
StrLength(S) |
返回串S的元素个数,即串的长度 |
StrCompare(S,T) |
若S>T返回值>0,若相等返回0,若S<T的返回值<0 |
Concat(T,S1,S2) |
用T返回由S1和S2联结成的新串 |
SubString(Sub,S,pos,len) |
若串存在,1<=pos<=StrLength(S),且0<=lenStrLength(S)-pos+1, 用Sub返回串S的第pos个字符起长度为len的子串。 |
Index(S,T,pos) |
串S和T存在,T是非空串,1<=pos<=StrLength(S) 若主串S中存在和串T相同的子串,则返回它在主串S中第pos个字符之后第一次出现的位置,否则返回0。 |
Replace(S,T,V) |
串S,T,V存在,T是非空串,用V替换主串S中出现的所有与T相等的不重叠的子串 |
StrInsert(S,pos,T) |
串S和T存在,1<=pos<=StrLength(S)+1 在串S的第pos个字符前插入串T |
StrDelete(S,pos,len) |
串S存在,1<=pos<=StrLength(S)-len+1 从串S中删除第pos个字符起长度为len的子串 |
串的存储结构:通常来说,串都是使用顺序存储结构来实现的,链式的存储结构不太适合串。串的顺序存储是由一组地址连续的存储单元来存储串中的字符序列的,按照预定义的大小,为每个定义的串变量分配一个固定长度的存储区,一般用定长数组实现,用'\n'来表示一个串值得终结。
串的实现,如下所示,使用javascript编写,依赖于数组方法。
//////////////////////////////////////基础部分/////////////////////////////////////////////////////////// function MyString(strArray) {
//均需依赖于数组的操作
this.strArray = strArray;
this.strCopy = function() {
var newString = new MyString();
newString.strArray = this.strArray.slice();
return newString;
}
this.clearString = function() {
this.strArray = [];
} this.stringEmpty = function() {
if (this.strLength() == 0) {
return true;
}
return false;
}
this.strLength = function() {
return this.strArray.length;
} this.strCompare = function(otherStrArray) {
var compareLength = Math.min(this.strLength(), otherStrArray.length);
var i;
for (i = 0; i < compareLength; i++) {
if (this.strArray[i] != otherStrArray[i]) {
break;
}
} if (this.strArray[i] > otherStrArray[i]) {
return 1;
} else if (this.strArray[i] == otherStrArray[i]) {
return 0;
} else {
return -1;
}
} this.concat = function(otherStrArray) {
var newString = new MyString();
newString.strArray = this.strArray.concat(otherStrArray);
return newString;
}
this.subString = function(pos, len) {
if (pos >= 0 && len >= 0 && pos + len < this.strLength()) {
var newString = new MyString();
newString.strArray = this.strArray.slice(pos, pos + len);
return newString;
}
}
this.index = function(subStrArray, pos) {
if (pos < 0 || subStrArray.length > this.strLength() || pos >= this.strLength() - subStrArray.length) {
return -1;
}
for (var i = pos; i < this.strLength(); i++) {
var tempI = i;
for (j = 0; j < subStrArray.length; j++) {
if (subStrArray[j] != this.strArray[tempI]) {
break;
}
tempI++;
}
// console.log(tempI);
if (tempI == i + subStrArray.length) {
return i - pos;
}
// console.log(i);
}
return -1;
} this.replace = function(originalSubStrArray, targetSubStrArray) {
//需要依赖于index方法
var pos = this.index(originalSubStrArray, 0);
this.strDelete(pos, originalSubStrArray.length);
this.strInsert(pos, targetSubStrArray);
} this.strInsert = function(pos, subStrArray) {
if (pos >= 0 && pos <= this.strLength()) {
var partA = this.strArray.slice(0, pos);
var partB = this.strArray.splice(pos, this.strLength());
this.strArray = partA.concat(subStrArray, partB);
}
} this.strDelete = function(pos, len) {
if (pos >= 0 && len >= 0 && pos + len <= this.strLength()) {
var partA = this.strArray.slice(0, pos);
var partB = this.strArray.splice(pos + len, this.strLength());
this.strArray = partA.concat(partB);
}
}
}
} //////////////////////////////////////测试部分///////////////////////////////////////////////////////////
var strArray = ['x', 'i', 'o', 'n', 'g', 'e', 'r'];
var otherStrArray = ['x', 'i', 'o', 'n', 'g', 'e', 'r'];
var tempStrArray = ['n', 'g'];
var replaceStrArray = ['t', 't']; var str = new MyString(strArray);
console.log(str);
var newStr = str.strCopy();
console.log(newStr);
console.log(newStr == str);
console.log(newStr === str);
console.log(newStr.strCompare(otherStrArray)); newStr = str.concat(otherStrArray);
console.log(newStr);
// var strArray = 'xionger'.split('');
// console.log(strArray);
// console.log(strArray.length);
newStr = str.subString(2, 2);
console.log(newStr); // str.strDelete(4, 2);
// console.log(str);
// str.strInsert(7, tempStrArray);
// console.log(str);
var index = str.index(tempStrArray, 2);
console.log(index); // str.replace(tempStrArray, replaceStrArray);
// console.log(str);
KMP模式匹配算法:可以看到之前的朴素模式匹配算法的时间复杂度为O(n2),效率比较低下,因此更合适的方式是由Knuth,Morris,Pratt三位科学家研究的模式匹配算法,可以大大的减少重复遍历的情况。在之前的朴素模式匹配的算法中存在两个嵌套的循环,外部循环不存在回溯,但存在重复比较,内部循环存在回溯。因此,可以想到的优化点就是内外循环的变量值得设置。这部分用文字表述将非常的复杂且不容易理解,接下来通过代码让我们来熟悉这部分知识,也是本文最难的部分。
借用博文http://www.cnblogs.com/c-cloud/p/3224788.html的解释,非常准确,有空时可以继续深入学习。
参考资料:
- 程杰. 大话数据结构[M]. 北京:清华大学出版社, 2011.
- 严蔚敏, 吴伟民. 数据结构(C语言版)[M]. 北京:清华大学出版社, 2004.
深入学习系列--Data Structure--02字符串的更多相关文章
- Python学习系列(三)(字符串)
Python学习系列(三)(字符串) Python学习系列(一)(基础入门) Python学习系列(二)(基础知识) 一个月没有更新博客了,最近工作上有点小忙,实在是没有坚持住,丢久又有感觉写的必要了 ...
- PHP学习系列(1)——字符串处理函数(1)
从09年开始使用JAVA到现在差不多5年多了,然后由于即将要去的公司(研究僧终于要毕业了!)是使用PHP,Python作为后台开发语言的,所以要开始一段双P的学习旅程.用过PHP的都说这是很简单的一门 ...
- PHP学习系列(1)——字符串处理函数(4)
16.hebrevc() 函数把希伯来文本从右至左的流转换为左至右的流.它也会把新行 (\n) 转换为 <br />.只有 224 至 251 之间的 ASCII 字符,以及标点符号受到影 ...
- PHP学习系列(1)——字符串处理函数(3)
11.crc32() 函数计算一个字符串的 crc32 多项式.生成 string 参数的 32 位循环冗余校验码多项式.该函数可用于验证数据的完整性. 语法:crc32(string) 注意:由于 ...
- PHP学习系列(1)——字符串处理函数(5)
31.ord() 函数返回字符串第一个字符的 ASCII 值. 语法:ord(string) 例子 <?php echo ord("h"); echo ord("h ...
- PHP学习系列(1)——字符串处理函数(2)
6.chunk_split() 函数把字符串分割为一连串更小的部分.本函数不改变原始字符串. 语法:chunk_split(string,length,end) 参数: string——必需.规定要分 ...
- 高级数据结构学习笔记 / Data Structure(updating)
树状数组 查询操作:O(logn) 修改操作:O(logn) #define lowbit(x) (x & -x) int tr[N]; // 树状数组 // 添加c个大小为x的数值 vo ...
- Python学习系列(六)(模块)
Python学习系列(六)(模块) Python学习系列(五)(文件操作及其字典) 一,模块的基本介绍 1,import引入其他标准模块 标准库:Python标准安装包里的模块. 引入模块的几种方式: ...
- Python学习系列(四)(列表及其函数)
Python学习系列(四)(列表及其函数) Python学习系列(一)(基础入门) Python学习系列(二)(基础知识) Python学习系列(三)(字符串) 一.基本概念 1,列表是什么? ...
随机推荐
- MapReduce --全排序
MapReduce全排序的方法1: 每个map任务对自己的输入数据进行排序,但是无法做到全局排序,需要将数据传递到reduce,然后通过reduce进行一次总的排序,但是这样做的要求是只能有一个red ...
- android BroadcastReceiver
AndroidManifast.xml <?xml version="1.0" encoding="utf-8"?> <manifest xm ...
- Hibernate学习(一)
一.基本概念 ORM(Object Relational Mapping)---是一种为了解决面向对象与关系型数据库存在的互不匹配的现象的技术.简单说: ORM 是通过使用描述对象和数据库之间映射的元 ...
- gawk快速入门
基本定义: gawk 的主要功能是针对文本的每一行执行被指定的 actions. 命令格式: gawk option program file option: -F 指定的分隔符,默认的分隔符是空格, ...
- XE3随笔7:可以省略的双引号
在 JSON 中, 字符串应该在双引号中; 从上个例子才发现: 原来这个双引号可以省略, 有空格都行 当然只是在程序代码中可以省略, 对象会自动识别添加的. 即如此, 下面写法都可以: uses Su ...
- 应该了解的Python模块
Python很优雅.使用以下模块有助于保持你的代码整洁.易于维护.欢迎补充. Docopt.忘了optparse和argparse吧,使用docstring来构建优雅的.高可读性.复杂(如果你有这个需 ...
- 设置EditText光标位置
editext.setSelection(int index);
- Training Deep Neural Networks
http://handong1587.github.io/deep_learning/2015/10/09/training-dnn.html //转载于 Training Deep Neural ...
- Unity多线程(Thread)和主线程(MainThread)交互使用类——Loom工具分享
Unity多线程(Thread)和主线程(MainThread)交互使用类——Loom工具分享 By D.S.Qiu 尊重他人的劳动,支持原创,转载请注明出处:http.dsqiu.iteye.com ...
- 无向图最小生成树(prim算法)
普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树.意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点,且其所有边的权值之和亦为最小.该算法于1930年由捷 ...