在C#中实现Python的分片技术
在C#中实现Python的分片技术
前言
之前在学习Python的时候发现Python中的分片技术超好玩的,本人也是正则表达式热爱狂,平时用C#比较多,所以决定把Python中的分片技术在C#中实现,添加到个人类库中,以便日后在写C#代码的时候能舔一舔Python的味道。
效果展示
Python版: C#版:
切割技术讲解
这里先简要讲解一下Python中的分片技术,其他Python前辈也对此技术有丰富多彩的讲解文章,这里只是简要说明一下,好让读者们能知道下怎么回事,如果想更深入了解Python的分片技术,这里并不适合你哦。
分片的对象可以是字符串或者序列,本文提供字符串的实现方法,其实序列差不多的,我也会在最后提供字符串和序列的实现代码,并且附带单元测试。
好了,废话不多说,其实看了上面的Python版的结果,我想聪明的您就略知一二了。分片的模板是:变量[起始位置:终点位置:步长],举个例子:a="abcdfeghij",那么a[0:2:1]这个的结果就是零位置开始(a的左边),步长为1(也就是连续取),到2位置结束(从a的左边开始:0->(a的左边),1->(b的左边,a的右边),2->(c的左边,b的右边)->结束),好了,结果就是"ab"。
注意事项:1.步长可以忽略不写(默认为1),如果步长为2,就每取一个跳过1个,以此类推。
2.可以使用负数a[-3:-1:1],结果是"ef",读者们可以自己推一下,很简单。
3.分片技术可以针对字符串,也可以针对序列。
实现过程
这里需要用到正则表达式的技术,可能对一些朋友来说比较难懂,但是我会尽量讲解的简单一点。
首先,要使用分片,有三个参数可以控制:起始位置,结束位置,步长。所以在正则表达式应该嵌入这三个参数变量,在匹配的时候动态生成正则表达式。下面来看需要把这三个参数放到哪里:
起始位置:
1.背景
这里使用肯定逆序环视,什么是肯定逆序环视,就是匹配到的位置那一点向后看,向后看的内容必须符合环视的内容,举个例子:文本:abc ,正则表达式:(?<=a)b,肯定逆序环视符号:(?<=exp),这个正则表达式的意思就是找到b,然后向后看(左边),如果是a就匹配成功,结果就是b(因为逆序环视是不纳入结果中)。
2.实现
我使用[\s\S]来表示一个任意符号,含有位置参数的部分放到左边,形成这样一个正则表达式:
(?<=^[\s\S]{StarIndex,})[\s\S] 注意这里的StarIndex是变量,可以是0,1,2,3..!以StarIndex=2(其实位置是2)为例,匹配一个任意字
符,并且向后看(左边)是开头->2个或者多个任意字符。
结束位置:
1.背景
这里使用肯定顺序环视,什么是肯定顺序环视,就是匹配到的位置那一点向前看,向前看的内容必须符合环视的内容,举个例子:文本abc ,正则表达式:(?=b)a,肯定逆序环视符号:(?=exp),这个正则表达式的意思就是找到a,然后向前看(右边),如果是b就匹配成功,结果就是a(因为顺序环视是不纳入结果中)。
2.实现
有了前面表达式基础,我需要在后面添加一个顺序环视,形成这样一个表达式(合并过后):
(?<=^[\s\S]{StarIndex,})[\s\S](?=[\s\S]{EndCount}),这里要注意了,EndCount并不是结束位置,计算公式:
EndCount=String.Length-EndIndex。字符串长度-结束位置。
步长:
最后终于到步长了,这是关键的一步,用于连接上面两部的,其实基础前面已经讲了,下面给出加入步长逻辑以后,形成的最后正则表达式:(?<=^[\s\S]{StarIndex,})(?<=^[\s\S]{MiddleCount})[\s\S](?=[\s\S]{EndCount}),步长参数为Step变量,这里的MiddleCount在循环中改变,每次循环都MiddleCount=MiddleCount+Step;循环到最后合并获取到的字符形成结果字符串!!。
实例演示
最后演示一下具体匹配实例,过程,结果。
字符串:a="abcdefghij"; a.Cut(0,3,1);
循环次数:3-0=3次。
循环一:表达式:(?<=^[\s\S]{0,})(?<=^[\s\S]{0})[\s\S](?=[\s\S]{7})
结果图: =====》'a'
循环二:表达式(?<=^[\s\S]{0,})(?<=^[\s\S]{1})[\s\S](?=[\s\S]{7})
结果图:=====》'b'
循环三:表达式(?<=^[\s\S]{0,})(?<=^[\s\S]{2})[\s\S](?=[\s\S]{7})
结果图:=====》'c'
最终合并结果:"abc"。最后贴一张Python中的结果:.
代码展示
public static class StringExpander
{
/// <summary>
/// Python中的字符串切片技术,[开始索引:结束索引:步长值]
/// </summary>
/// <param name="Str">目标字符串</param>
/// <param name="StarIndex">开始索引</param>
/// <param name="EndIndex">结束索引</param>
/// <param name="Step">步长值</param>
/// <returns></returns>
public static String StringCut(this String Str, Int32 StarIndex, Int32 EndIndex, Int32 Step = )
{
if (EndIndex < )
{ EndIndex = Str.Length + EndIndex; }
if (StarIndex < )
{ StarIndex = Str.Length + StarIndex; }
StringBuilder sb = new StringBuilder();
Int32 LoopTime = EndIndex - StarIndex;
if (EndIndex > Str.Length) { EndIndex = Str.Length; }
Int32 EndCount = Str.Length - EndIndex;
int j = StarIndex;
for (int i = ; i < LoopTime; i = i + Step)
{
String RegexString = @"(?<=^[\s\S]{" + StarIndex + @",})(?<=^[\s\S]{" + j + @"})[\s\S](?=[\s\S]{" + EndCount + @"})";
try
{
sb.Append(Regex.Match(Str, RegexString).Value);
}
catch { }
j = j + Step;
}
return sb.ToString();
}
/// <summary>
/// Python中的字符串切片技术,只提供位置
/// </summary>
/// <param name="Str">目标字符串</param>
/// <param name="StarIndex">位置</param>
/// <returns></returns>
public static String StringCut(this String Str, Int32 StarIndex)
{
if (StarIndex < )
{ StarIndex = Str.Length + StarIndex; }
return Str.Substring(StarIndex, );
}
}
总结
现在提供的是字符串的实现方法,在下面可以下载Demo,里面有序列的实现方法,思想差不多,但是需要添加点东西。谢谢大家观看!
在C#中实现Python的分片技术的更多相关文章
- 3.Python编程语言基础技术框架
3.Python编程语言基础技术框架 3.1查看数据项数据类型 type(name) 3.2查看数据项数据id id(name) 3.3对象引用 备注Python将所有数据存为内存对象 Python中 ...
- 8天学通MongoDB——第六天 分片技术
在mongodb里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内存 就吃不消了,针对这样的场景我们该如何应对. 一:分片 mong ...
- MongoDB分片技术[转]
8天学通MongoDB——第六天 分片技术 在mongodb里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内存 就吃不消了,针 ...
- Delphi中使用python脚本读取Excel数据
Delphi中使用python脚本读取Excel数据2007-10-18 17:28:22标签:Delphi Excel python原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 . ...
- iOS 开发者旅途中的指南针 - LLDB 调试技术
文章转载于:iOS 开发者旅途中的指南针 - LLDB 调试技术 今天给大家介绍的内容,无关乎任何功能性开发技术,但又对开发的效率影响至深,这就是调试技术. 何为调试呢,比如我们用 print 函数在 ...
- [译]如何在Web开发中使用Python
[译]如何在Web开发中使用Python 原文:HOWTO Use Python in the Web 摘要 这篇文档展示了Python如何融入到web中.它介绍了几种Python结合web服务器的方 ...
- MP4大文件虚拟HLS分片技术,避免服务器大量文件碎片
MP4大文件虚拟HLS分片技术,避免点播服务器的文件碎片 本文主要介绍了通过虚拟分片技术,把MP4文件,映射为HLS协议中的一个个小的TS分片文件,实现了在不实际切分MP4文件的情况下,通过HLS协议 ...
- 在Java中调用Python
写在前面 在微服务架构大行其道的今天,对于将程序进行嵌套调用的做法其实并不可取,甚至显得有些愚蠢.当然,之所以要面对这个问题,或许是因为一些历史原因,或者仅仅是为了简单.恰好我在项目中就遇到了这个问题 ...
- 在VS Code中对Python进行单元测试
在VS Code中对Python进行单元测试 Python扩展支持使用Python的内置unittest框架以及pytest和Nose进行单元测试.要使用pytest和Nose,必须将它们安装到当前的 ...
随机推荐
- roscpp源码阅读
roscpp doxgen 这只是我摘取的一些主要代码 node_handle.cpp //NodeHandle的构造函数 void NodeHandle::construct(const std:: ...
- AJAX请求和跨域请求详解(原生JS、Jquery)
一.概述 AJAX 是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术. AJAX = 异步 JavaScript 和 XML,是一种用于创建快速动态网页的技术.通过在后台与服务器进行少量数 ...
- ASP.NET MVC +EasyUI 权限设计(四)角色动作
请注明转载地址:http://www.cnblogs.com/arhat 由于最近的事情比较多,一直忙于工作和照顾老婆,所以老魏更新的速度慢了,本来写文章就要占据工作和生活很多的时间,这也就是院子中很 ...
- 基础才是重中之重~理解linq中的groupby
linq将大部分SQL语句进行了封装,这使得它们更加面向对象了,对于开发者来说,这是一件好事,下面我从基础层面来说一下GroupBy在LINQ中的使用. 对GroupBy的多字段分组,可以看我的这篇文 ...
- ZOJ 2314 带上下界的可行流
对于无源汇问题,方法有两种. 1 从边的角度来处理. 新建超级源汇, 对于每一条有下界的边,x->y, 建立有向边 超级源->y ,容量为x->y下界,建立有向边 x-> 超级 ...
- Daily Scrum 11.11
摘要:本次会议继续讨论程序的问题以及单元测试和集成测试,本次测试为1.02版本.本次的Task列表如下: Task列表 出席人员 Today's Task Tomorrow's Task 刘昊岩 t ...
- iOS VideoToolbox硬编H.265(HEVC)H.264(AVC):1 概述
本文档尝试用Video Toolbox进行H.265(HEVC)硬件编码,视频源为iPhone后置摄像头.去年做完硬解H.264,没做编码,技能上感觉有些缺失.正好刚才发现CMFormatDescri ...
- 用protobuf编译时报错:protoc: error while loading shared libraries: libprotoc.so.9: cannot open shared object file: No such file or directory 的解决方法
解决办法:export LD_LIBRARY_PATH=/usr/local/lib
- 学习Ember遇到的一些问题
1.在模板中不能省略结束标签: 在Ember的模板中,如果省略结束标签的话,会有好多无解的问题(可能是:不更新.更新后结构不对.model和view不同步等),苦苦找了很久.... 2.childVi ...
- C# WinForm开发系列 - ZedGraph
ZedGraph是用于创建任意数据的二维线型.条型.饼型图表的一个类库,也可以作为Windows窗体用户控件和Asp.Net网页控件.这个类库具有高度的适应性,几乎所有式样的图表都能够被创建.这个类库 ...