[转]标准C++字符串string以及MFC6.0字符串CString的tokenize和split函数
标准字符串的方法:
/******************************************** the tokenize function for std::string *********************************************/
#include <string>
#include <vector>
#include <iostream>
using namespace std; typedef basic_string<char>::size_type S_T;
static const S_T npos = -; ////trim指示是否保留空串,默认为保留。
vector<string> tokenize(const string& src, string tok, bool trim=false, string null_subst="")
{
if( src.empty() || tok.empty() ) throw "tokenize: empty string\0"; vector<string> v;
S_T pre_index = , index = , len = ;
while( (index = src.find_first_of(tok, pre_index)) != npos )
{
if( (len = index-pre_index)!= )
v.push_back(src.substr(pre_index, len));
else if(trim==false)
v.push_back(null_subst);
pre_index = index+;
}
string endstr = src.substr(pre_index);
if( trim==false ) v.push_back( endstr.empty()? null_subst:endstr );
else if( !endstr.empty() ) v.push_back(endstr);
return v;
} ////使用一个完整的串delimit(而不是其中的某个字符)来分割src串,没有trim选项,即严格分割。
vector<string> split(const string& src, string delimit, string null_subst="")
{
if( src.empty() || delimit.empty() ) throw "split: empty string\0"; vector<string> v;
S_T deli_len = delimit.size();
long index = npos, last_search_position = ;
while( (index=src.find(delimit, last_search_position))!=npos )
{
if(index==last_search_position)
v.push_back(null_subst);
else
v.push_back( src.substr(last_search_position, index-last_search_position) );
last_search_position = index + deli_len;
}
string last_one = src.substr(last_search_position);
v.push_back( last_one.empty()? null_subst:last_one );
return v;
} // test
int main(void)
{
string src = ",ab,cde;,,fg,," ;
string tok = ",;" ; vector<string> v1 = tokenize(src, tok ,true);
vector<string> v2 = tokenize(src, tok ,false, "<null>"); cout<<"-------------v1:"<<endl;
for(int i=; i<v1.size();i++)
{
cout<<v1[i].c_str()<<endl;
} cout<<"-------------v2:"<<endl;
for(int j=; j<v2.size();j++)
{
cout<<v2[j].c_str()<<endl;
} try{ string s = "######123#4###56########789###";
string del = "";//"###";
vector<string> v3 = split(s, del, "<null>");
cout<<"-------------v3:"<<endl;
for(int k=; k<v3.size();k++)
{
cout<<v3[k].c_str()<<endl;
}
}
catch (char *s) {
cout<<s<<endl;
} return ;
}
CString的方法:
#include <stdio.h>
#include <afx.h> /*
* 该函数用delimits里的字符拆分s,传出一个CStringList指针pList,
* 若trim为真,则不保留分割后的空串(注意不是空白字符)。比如:
* Tokenize( "a,bc;,d,", ",;", &out_list, TRUE)
* 会返回3个串:a、bc、d。
* 若trim为FALSE,则用nullSubst用来替代分割后的空串,比如:
* Tokenize( "a,bc;,d;", ",;", &out_list, FALSE,"[null]" )
* 会返回5个串:a、bc、[null]、d、[null]。
* trim默认为FALSE,nullSubst默认为空串。
*/
void Tokenize(CString s, CString delimits, CStringList* pList, BOOL trim=FALSE, CString nullSubst="")
{
ASSERT( !s.IsEmpty() && !delimits.IsEmpty() ); s += delimits[];
for( long index=-; (index=s.FindOneOf((LPCTSTR)delimits))!=-; )
{
if(index != ) pList->AddTail( s.Left(index) );
else if(!trim) pList->AddTail(nullSubst);
s = s.Right(s.GetLength()-index-);
}
} /*
* 类似java字符串的split()方法。
* 使用一个完整的串delimit(而不是其中的某个字符)来分割src串,没有trim选项,
* 即严格分割。num用来确定最多分割为多少个串,如果是0(默认),则按照delimit
* 分割,若为1,则返回源串。
*/
void Split(const CString& src, CString delimit, CStringList* pOutList, int num=, CString nullSubst="")
{
ASSERT( !src.IsEmpty() && !delimit.IsEmpty() );
if(num==)
{
pOutList->AddTail(src);
return;
} int deliLen = delimit.GetLength();
long index = -, lastSearchPosition = , cnt = ; while( (index=src.Find(delimit, lastSearchPosition))!=- )
{
if(index==lastSearchPosition)
pOutList->AddTail(nullSubst);
else
pOutList->AddTail(src.Mid(lastSearchPosition, index-lastSearchPosition));
lastSearchPosition = index + deliLen; if(num)
{
++cnt;
if(cnt+==num) break;
}
}
CString lastOne = src.Mid(lastSearchPosition);
pOutList->AddTail( lastOne.IsEmpty()? nullSubst:lastOne);
} // test
int main(void)
{
CString s = ",ab;cde,f,,;gh,,";
CString sub = ",;";
CStringList list1,list2; Tokenize(s,sub,&list1,TRUE,"no use"); // <-----
printf("-------[Tokenize_trim]-------\n");
POSITION pos1 = list1.GetHeadPosition();
while( pos1!= NULL )
{
printf( list1.GetNext(pos1) );
printf("\n");
}
Tokenize(s,sub,&list2,FALSE,"[null]"); // <-----
printf("------[Tokenize_no_trim]-----\n");
POSITION pos2 = list2.GetHeadPosition();
while( pos2!= NULL )
{
printf( list2.GetNext(pos2) );
printf("\n");
} CStringList list3;
s = "###0123###567######89###1000###";
sub = "###";
Split(s,sub,&list3, , "<null>"); // <-----
printf("------[Split]-----\n");
POSITION pos3 = list3.GetHeadPosition();
while( pos3!= NULL )
{
printf( list3.GetNext(pos3) );
printf("\n");
}
return ;
}
[转]标准C++字符串string以及MFC6.0字符串CString的tokenize和split函数的更多相关文章
- 为什么字符串String是不可变字符串&&"".equals(str)与str.equals("")的区别
为什么字符串String是不可变字符串 实际上String类的实现是char类型的数组 虽然说源码中设置的是private final char[] value; final关键词表示不可变动 但是只 ...
- VK Cup 2012 Qualification Round 2 C. String Manipulation 1.0 字符串模拟
C. String Manipulation 1.0 Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 codeforces.com/problemset/pr ...
- Java 中的字符串(String)与C# 中字符串(string)的异同
1. C# 中比较两个字符串字面量是否相等,可以使用 “==”比较运算符,是因为string 类型重写(override)了“==” 和 “!=” 运算符,在使用“==” 和 “!=” 进行字符串比较 ...
- lua中 string.find(查找获取字符串) string.gsub(查找替换字符串) string.sub(截取字符串)
> aaa='/p/v2/api/winapi/adapter/lgj'> print(string.find(aaa, "^/.+/adapter/(.*)"))1 ...
- Java基础——数组应用之字符串String类
字符串String的使用 Java字符串就是Unicode字符序列,例如串“Java”就是4个Unicode字符J,a,v,a组成的. Java中没有内置的字符串类型,而是在标准Java类库中提供了一 ...
- 自定义实现字符串string的接口
用char*管理String类的内存,new动态分配,在析构函数中delete char*指向的new出来的内存,一个string类需要实现那些接口可参考标准库里的string: http://ww ...
- Swift 3.0 字符串、数组、字典的使用
1.字符串 string func stringTest() -> Void { // 字符串 let str1 = "yiyi" let str2 = "2222 ...
- C#解析"a=1&b=2&c=3"字符串,微信支付返回字符串,替换<br>为&
原文来自: http://www.mzwu.com/article.asp?id=2802 C#可用: 若该字符串是使用Http Get发送,url?a=1&b=2&c=3,使用下边代 ...
- js使用split函数按照多个字符对字符串进行分割的方法
这篇文章主要介绍了js使用split函数按照多个字符对字符串进行分割的方法,实例分析了split函数的使用技巧,非常具有实用价值,需要的朋友可以参考下 本文实例讲述了js使用split函数按照多个 ...
随机推荐
- 解决IE11只能用管理员身份运行的问题
解决IE11只能用管理员身份运行的问题 IE11 打不开,必须要用管理员身份运行才可以打开,而且重置浏览器这个方法也不奏效. 今天本人也遇到了,上网查找发现是注册表权限的问题,原因尚不明确,安装了或被 ...
- [Red5]Red5之Flash流媒体服务器的安装与使用教程完整版(组图)
参看下面链接:http://www.cuplayer.com/player/PlayerCode/Red5/2013/0319/760.html
- js 事件小结
1,事件对象 e || window.event //ie 2, 取鼠标点击坐标 带有滚动条的 var top = document.documentElement.scrollTop | ...
- iOS开发之网络篇-各种网络状态码
1xx消息 这一类型的状态码,代表请求已被接受,需要继续处理.这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束.由于HTTP/1.0协议中没有定义任何1xx状态码,所以除非在某些试 ...
- 分析java 嵌套类与内部类
一.什么是嵌套类及内部类? 可以在一个类的内部定义另一个类,这种类称为嵌套类(nested classes),它有两种类型:静态嵌套类和非静态嵌套类.静态嵌套类使用很少,最重要的是非静态嵌套类 ...
- Myeclipse6.5配置反编译插件
PS:jad.exe位置与Myeclipse6.5安装目录平行
- 夏宇闻教授谈FPGA工程师的入门学习
1. 必须清楚自己究竟适合不适合做工程师. 看看自己的性格特点,是不是特别安静,又耐得住寂寞.因为FPGA工程师是一个辛苦的工作,不但要通过不断学习研究提升自己的设计水平,还要经常性的熬夜加班敲写代码 ...
- 【Xamarin挖墙脚系列:Mono项目的图标为啥叫Mono】
因为发起人大Boss :Miguel de lcaza 是西班牙人,喜欢猴子.................就跟Hadoop的创始人的闺女喜欢大象一样...................... 历 ...
- jQuery多版本的使用,同一文件多个版本引用
<html> <meta http-equiv="Content-Type" content="text/html; charset=utf-8&quo ...
- Java开发者工具
From:http://www.csdn.net/article/2015-03-26/2824317 1. Notepad++ Notepad++是用于编辑xml.脚本以及记笔记的最佳工具.这个工具 ...