C++ 字符串分割

C++ 字符串分割C++中经常需要对字符串按照指定字符或字符串进行分割操作以获得子串。下面给出具体实现。版本一://qsort函数需要的比较函数,按照升序排序intcomp(constvoid*a,constvoid*b){ return*(int*)a-*(int*)b;}//按指定分隔符分割字符串//src:源字符串delimiter:分隔符集合vector<string&…

大家好,又见面了,我是你们的朋友全栈君。

编译运行环境:VS2017 + Win32 + Debug


C++ 中经常需要对字符串按照分隔符进行分割以获得子串序列,子串的顺序与其在原字符串中出现的顺序一致。一般有两种需求场景:
(1)给定一个分隔符(单个字符或子串)分割字符串;
(2)给定一个或多个分隔符(单个字符),分割字符串。

当给定的分隔符不在原字符串中,则原字符串不被分割,返回单个元素为原字符串的 vector。

注意,本文实现时,如果被分割后的子串为空串,则不计入最终的子串序列。比如原字符串是”a,b”,分隔符为”,”,那么分割后的子串序列为 [“a”, “b”],而不是 [“a”, “”, “b”]。

1.单个分隔符(单个字符或子串)分割字符串

#include <iostream>
#include <vector>
#include <string>
using namespace std;

//@brief: 指定单个分隔符(单个字符或子串)分割字符串
//@param: src 原字符串;delimiter 分隔符,单个字符或子串
vector<string> splitStr(const string& src, const string& delimiter) { 
   
	std::vector<string> vetStr;
	
	// 入参检查
	// 1.原字符串为空或等于分隔符,返回空 vector
	if (src == "" || src == delimiter) { 
   
		return vetStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") { 
   
		vetStr.push_back(src);
		return vetStr;
	}

	string::size_type startPos = 0;
	auto index = src.find(delimiter);
	while (index != string::npos) { 
   
		auto str = src.substr(startPos, index - startPos);
		if (str != "") { 
   
			vetStr.push_back(str);
		}
		startPos = index + delimiter.length();
		index = src.find(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") { 
   
		vetStr.push_back(str);
	}

	return vetStr;
}

测试如下:

int main(int argc, char* argv[]) { 
   
	string str = "I,love,China";

	// 正常分割
	auto vetStr = splitStr(str, ",");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "I,");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "what");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 3
I love China
vetStr.size() = 1
love,China
vetStr.size() = 1
I,love,China

2.单个或多个分隔符(单个字符)分割字符串

实现和单个分隔符(单个字符或子串)分割字符串基本一致,关键地方是将获取分隔符下标的函数由 std::string::find(…) 改为 std::string::find_first_of(…)。二者的区别如下:

std::string::find(...)
	将分隔符看作一个整体在原字符串中查找并返回匹配的下标,比如 string("I love China").find("love") 返回 2。
std::string::find_first_of(...)
	在字符串中搜索分隔符中任意一个字符出现的第一个位置。与 std::string::find(...) 的区别是不需要整个分隔符匹配,只需要分隔符中的单个字符匹配即可。

具体实现如下:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 单个或多个分隔符(单个字符)
vector<string> splitStr(const string& src, const string& delimiter) { 
   
	std::vector<string> vtStr;

	// 入参检查
	// 1.原字符串为空返回空 vector
	if (src == "") { 
   
		return vtStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") { 
   
		vtStr.push_back(src);
		return vtStr;
	}

	string::size_type startPos = 0;
	auto index = src.find_first_of(delimiter);
	while (index != string::npos) { 
   
		auto str = src.substr(startPos, index - startPos);
		if (str != "") { 
   
			vtStr.push_back(str);
		}
		startPos = index + 1;
		index = src.find_first_of(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") { 
   
		vtStr.push_back(str);
	}

	return vtStr;
}

测试如下:

int main(int argc, char* argv[]) { 
   
	string str = "I,love,China";

	// 正常分割。按照 h 与逗号分割
	auto vetStr = splitStr(str, "h,");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "Ia");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "_:");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 4
I love C ina
vetStr.size() = 1
,love,Chin
vetStr.size() = 1
I,love,China

3.反面实例

下面是我情急之下实现的单个或多个分隔符(单个字符)分割字符串的函数,有点“脏乱差”,作为反面教材,希望能够帮助大家时刻记住代码的简洁与优雅是多么可贵,大家可以对比感受一下。另外,适当的代码注释,对提高代码的可读性会有很大帮助。

脏乱差版本一:

//qsort函数需要的比较函数,按照升序排序
int comp(const void*a,const void*b) { 

return *(int*)a-*(int*)b;
}
//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
vector<string> splitStr(const string& src,const string& delimiter) { 

vector<string> strRes;
int maxSubstrNum=src.size();
int* pos=new int[maxSubstrNum];
memset(pos,0,maxSubstrNum*sizeof(int));
int j=0;
for(size_t i=0;i<delimiter.size();++i) { 

string::size_type index=src.find(delimiter[i]);
while(index!=string::npos) { 

pos[j++]=index;
index=src.find(delimiter[i],index+1);
}		
}
//排序
qsort(pos,j,sizeof(int),comp);
//取出第一个子串
string substrFir=src.substr(0,pos[0]);
if(substrFir!="") 
strRes.push_back(substrFir);
//取出中间j-1个子串
for(int i=0;i<j-1;++i) { 

string substr=src.substr(pos[i]+1,pos[i+1]-pos[i]-1);
if(substr!="") { 

strRes.push_back(substr);
}
}
//取出最后一个子串
string substrLast=src.substr(pos[j-1]+1,src.size()-pos[j-1]-1);
if(substrLast!="") { 

strRes.push_back(substrLast);
}
delete[] pos;
return strRes;
}

代码主要说明:
(1)利用 find() 和 substr() 函数实现分割功能;
(2)代码中,需要对分割符出现的下标进行排序,这样才能顺序取出子串。

脏乱差版本二:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
std::vector<std::string> splitStr(const std::string &sStr, const std::string &sSep) { 

std::vector<std::string> vt;
std::string::size_type pos = 0;
std::string::size_type pos1 = 0;
int pos_tmp = -1;
while(true) { 

std::string s;
std::string s1;
pos1 = sStr.find_first_of(sSep, pos);
if(pos1 == std::string::npos) { 

if(pos + 1 <= sStr.length()) { 

s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos);
s1 = "";
}
} else if(pos1 == pos && (pos1 + 1 == sStr.length())) { 

s = "";
s1 = "";
} else { 

s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos, pos1 - (-1 != pos_tmp ? pos_tmp : pos));
s1 = sStr.substr(pos1 + 1);
if (-1 == pos_tmp) { 

pos_tmp = pos;
}
pos = pos1;
}
if(!s.empty()) { 

vt.push_back(s);
}
pos_tmp = -1;
if(pos1 == std::string::npos) { 

break;
}
pos++;
}
return vt;
}

参考文献

[1] C++ Reference.std::string
[2] C++ Reference.std::string::find
[3] C++ Reference.std::string::find_first_of
[4] C++常用字符串分割方法实例汇总

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/131339.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • HC32F460开发之rtthread+finsh组件的移植

    HC32F460开发之rtthread+finsh组件的移植文章目录前言一、RT-Thread简介二、rtthread的移植1.裸机例程2.RT-Thread下载2.RT-Thread移植总结前言对于从事单片机的开发人员,操作系统可以说是绕不过的一个必修课程。在稍复杂的应用开发中,一个好的操作系统可以帮助我们将单片机的资源最大化的利用起来,而系统提供的各种API接口也可以可靠地帮我们实现各种应用逻辑功能。日常生活里,在各种各样的电子设备中,操作系统被广泛地应用,常见的有Linux,ucos,以及现在在各种物联网设备中被广泛应用的freertos,RT-Thre

  • android移动点餐系统内容和要求,基于Android云计算的移动点餐系统

    android移动点餐系统内容和要求,基于Android云计算的移动点餐系统摘要:系统发挥Android富有创造力和想象力的云应用开发,实现一套Android客户端软件和完善的后台服务功能来完成点餐功能。该系统主要包括后台数据库服务器、WEB服务器、无线网络、Android前端等部分。客户端Android系统智能手机具有前端处理与计算能力,而且通过无线网络访问WEB服务器,如果需要数据访问,则访问后台数据库。介绍了系统架构的设计与搭建、技术选型、后台数据库的…

  • 操作系统–银行家算法c语言代码

    操作系统–银行家算法c语言代码直接上代码了,两个文件分别是main.c和banker.hmain.c#include#include#include”banker.h”//试探分配voidProbeAlloc(intprocess,RESOURCE*res){Available.A-=res->A;Available.B-=res->B;

  • Java3大框架学习,今年最受欢迎的后端框架

    Java3大框架学习,今年最受欢迎的后端框架作为20多年来最流行的编程语言,Java拥有一整套后端框架,但它们的可靠性和多功能性差异很大。当今最流行的Java后端框架是:SpringFramework Struts HibernateJava后端框架的比较:框架 优势 弱点 SpringFramework 1.许多现成的组件对Web应用程序有帮助2.DI和IoC创建灵活的配置3.易于暴露RESTful服务 1.许多依赖2.丰富的选择可能导致混乱3.学习曲线,因为它可以做很多..

  • Windows 7 资源管理器搜索Channel 9 视频[通俗易懂]

    Windows 7 资源管理器搜索Channel 9 视频[通俗易懂]在Windows7中FederatedSearch可以通过OpenSearch协议访问到远程数据资源,也就意味着用户可以使用资源管理器(WindowsExplorer)搜索并浏览远程数据。本篇我们将制作一个搜索连接器(SearchConnector)查找Channel9上的视频资料。FederatedSearch工作原理下图描绘了Fed…

  • java 除法取整_java 除法运算只保留整数位的4种方式

    java 除法取整_java 除法运算只保留整数位的4种方式1.情景展示根据提供的毫秒数进行除法运算,如果将毫秒数转换成小时,小时数不为0,则只取整数位,依此类推…2.情况分析可以使用3个函数实现Math.floor(num)  只保留整数位Math.rint(num)  余数四舍五入Math.ceil(num)  取整位,再+1举例:doublenum=3.1415926;System.out.println(Math.floor…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号