【C++实现python字符串函数库】字符串匹配函数startswith与endswith

这两个函数用于匹配字符串的开头或末尾,判断是否包含另一个字符串,它们返回bool值。startswith()函数判断文本的指定范围字符段是否以某个字符开始,endswith()函数判断文本是否以某个字符结束。默认的指定范围为整个字符串:

>>>
>>> a
'abcdefghijklmn'
>>> a.startswith('abc')
True
>>> a.endswith('klmn')
True
>>> a.startswith('bc')
False
>>> a.endswith('nm')
False
>>>

也可以指定一个匹配范围:

>>>
>>> a
'abcdefghijklmn'
>>> a.startswith('cd',2,10)
True
>>>

python字符串范围校准。

在使用字符串函数时,很多时候我们可以使用start与end参数来指定要进行操作的字符串的一个范围。例如在上面的函数中我们就使用到了('cd',2,10)语句,来对字符串a下标从2~10的范围进行匹配操作。

当我们输入的范围不合法时,python是如何处理的呢?例如我们输入了一个负数的start或者输入一个远大于字符串长度的end,python的处理绝不是以字符串开始或结束位置作为标准来校正范围,请看下面这段程序:

>>> a
'abcdefghijklmn'
>>> len(a)
14
>>> a.startswith('ef',-10,10) #实际范围:(-10+14,10)=(4,10)

具体的校准方法,我们可以使用这函数来描述:


void AdjustIndices(int &start, int & end, std::string::size_type len)
{
len =(int)len;
//如果end超出字符串长度
if (end > len)
end = len; //则以字符串长度为准
else if (end < 0)
{//如果end为负数
end += len; //则先加上字符串长度
if (end < 0)//如果还是为负数
end = 0;//则为0
}
//如果start为负数
if (start < 0)
{
//则加上字符串长度,注意不是以0校准
start += len;
if (start < 0)//如果还是负数
start = 0;//才以0校准
}
}

然而在我们的函数库实现中,我们并不打算把范围校准操作作为一个函数。我们将它作为一个宏来处理,原因如下:

  • 操作简单,不会出来宏函数常见的问题,直接的替换足以解决问题。
  • 省去函数调用的花销
  • 多个地方都需要范围校准。

C++实现

范围校准宏

#define ADJUST_INDICES(start, end, len)     \
if (end > len) \
end = len; \
else if (end < 0) { \
end += len; \
if (end < 0) \
end = 0; \
} \
if (start < 0) { \
start += len; \
if (start < 0) \
start = 0; \
}

有上面的解说,这段宏定义应该看得懂。

_string_tailmatch函数

	//匹配函数:endswith与startwith的内部调用函数
int _string_tailmatch(const std::string&self, const std::string&substr, int start, int end, int direction)
{
int selflen = (int)self.size();
int slen = (int)substr.size(); const char* str = self.c_str();
const char* sub = substr.c_str(); //对输入的范围进行校准
ADJUST_INDICES(start, end, selflen); //字符串头部匹配(即startswith)
if (direction < 0)
{
if (start + slen>selflen)
return 0;
}
//字符串尾部匹配(即endswith)
else
{
if (end - start<slen || start>selflen)
return 0;
if (end - slen > start)
start = end - slen;
}
if (end - start >= slen)
//mcmcmp函数用于比较buf1与buf2的前n个字节
return !std::memcmp(str + start, sub, slen);
return 0; }

endswith函数

bool endswith(const std::string&str, const std::string&suffix, int start = 0, int end = MAX_32BIT_INT)
{
     //调用_string_tailmatch函数,参数+1表示字符串尾部匹配
int result = _string_tailmatch(str, suffix, start, end, +1);
return static_cast<bool>(result);
}

startswith函数

	bool startswith(const std::string&str, const std::string&suffix, int start = 0, int end = MAX_32BIT_INT)
{
//调用_string_tailmatch函数,参数-1表示字符串头部匹配
int result = _string_tailmatch(str, suffix, start, end, -1);
return static_cast<bool>(result);
}

测试

	string str = "abcdefghijklmn";

	string temp1 = "ab";
cout << startswith(str, temp1)<<endl;//使用默认参数 string temp2 = "mn";
cout << endswith(str, temp2) << endl; string temp3 = "ef";
cout << startswith(str, temp3, 4, 10)<<endl; string temp4 = "qq";
cout << startswith(str, temp3, 0, 100) << endl;

测试结果

【C++实现python字符串函数库】二:字符串匹配函数startswith与endswith的更多相关文章

  1. python实现 字符串匹配函数

    通配符是 shell 命令中的重要功能,? 表示匹配任意 1 个字符,*表示匹配 0 个或多个字符.请使用你熟悉的编程语言实现一个字符串匹配函数,支持 ? 和 * 通配符.如 "a?cd*d ...

  2. numpy函数库中一些常用函数的记录

    ##numpy函数库中一些常用函数的记录 最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在<机器学习实战>的学习中,对遇到的一些函数的用法进行记录. (1) ...

  3. C语言字符串匹配函数

    C语言字符串匹配函数,保存有需要时可以用: #include <stdio.h> #include <stdlib.h> #include <string.h> # ...

  4. Python中字符串String的基本内置函数与过滤字符模块函数的基本用法

    Python中字符串String的基本内置函数与用法 首先我们要明白在python中当字符编码为:UTF-8时,中文在字符串中的占位为3个字节,其余字符为一个字节 下面就直接介绍几种python中字符 ...

  5. Python字符串常用方法(二)

    二.字符串的操作常用方法 字符串的替换.删除.截取.复制.连接.比较.查找.分割等 1. string. lower() :转小写 2. string. upper() :转大写 3. string. ...

  6. Python字符串中删除特定字符

    分析 在Python中,字符串是不可变的.所以无法直接删除字符串之间的特定字符. 所以想对字符串中字符进行操作的时候,需要将字符串转变为列表,列表是可变的,这样就可以实现对字符串中特定字符的操作. 1 ...

  7. python字符串格式化方法%s和format函数

    1.%s方法 一个例子 print("my name is %s and i am %d years old" %("xiaoming",18) 输出结果:my ...

  8. BZOJ4259:残缺的字符串(FFT与字符串匹配)

    很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n.可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺. 你想对这两 ...

  9. 逆向 time.h 函数库 time、gmtime 函数

    0x01 time 函数 函数原型:time_t time(time_t *t) 函数功能:返回自纪元 Epoch(1970-01-01 00:00:00 UTC)起经过的时间,以秒为单位.如果 se ...

随机推荐

  1. FJOI省队集训 chessboard

    (题目懒得打字了,建议到新窗口查看) 显然这玩意儿是可以按位搞的...然后就是一个裸的最小割模型? 然而这样做理论上只有30分实际上有40分. 事实上我们可以发现,每一列的取值只和上一列有关,这样我们 ...

  2. Android入门篇2-activity调用跟数据传递

    一.activity调用 假设ActivityTest调用SecondActivity 1.显示调用 button1.setOnClickListener(new View.OnClickListen ...

  3. 漫谈python中的搜索/排序

    在数据结构那一块,搜索有顺序查找/二分查找/hash查找,而排序有冒泡排序/选择排序/插入排序/归并排序/快速排序.如果遇到数据量和数组排列方式不同,基于时间复杂度的考虑,可能需要用到混合算法.如果用 ...

  4. js中三个对数组操作的函数 indexOf()方法 filter筛选 forEach遍历 map遍历

     indexOf()方法  indexOf()方法返回在该数组中第一个找到的元素位置,如果它不存在则返回-1. 不使用indexOf时 var arr = ['apple','orange','pea ...

  5. 使用管道(PipeLine)和批量(Batch)操作

    使用管道(PipeLine)和批量(Batch)操作 前段时间在做用户画像的时候,遇到了这样的一个问题,记录某一个商品的用户购买群,刚好这种需求就可以用到Redis中的Set,key作为product ...

  6. NET WebApi OWIN 实现 OAuth 2.0

    NET WebApi OWIN 实现 OAuth 2.0 OAuth(开放授权)是一个开放标准,允许用户让第三方应用访问该用户在某一网站上存储的私密的资源(如照片,视频,联系人列表),而无需将用户名和 ...

  7. 学习C++.Primer.Plus 4 复合类型

    本章介绍的有复合类型有: 数组. 字符串. 结构. 共用体. 指针 数组: 声明数组时数组长度必须为常量(或const). 只有初始化时可以用“=”,其它时候均不可以给数组直接赋值,除了赋值的元素以外 ...

  8. MFC 调试方法

    AfxDebugBreak     MFC 提供特殊的 AfxDebugBreak 函数,以供在源代码中对断点进行硬编码:     AfxDebugBreak( ); 在 Intel 平台上,AfxD ...

  9. PRML读书会第七章 Sparse Kernel Machines(支持向量机, support vector machine ,KKT条件,RVM)

    主讲人 网神 (新浪微博: @豆角茄子麻酱凉面) 网神(66707180) 18:59:22  大家好,今天一起交流下PRML第7章.第六章核函数里提到,有一类机器学习算法,不是对参数做点估计或求其分 ...

  10. c:forEach 标签中varStatus的用法

    c:forEach varStatus属性 current 当前这次迭代的(集合中的)项index  当前这次迭代从 0 开始的迭代索引count  当前这次迭代从 1 开始的迭代计数first 用来 ...