前两天同事遇到了一个小需求,想判断一个集合是不是在另一个集合中存在,并且要求顺序一致,然后一起讨论了下应该怎么做,有没有什么比较好的方式?下面分享一下我们想到的方法,如果你也有不同的想法也可以分享给我。

01解法一:序列化字符串(不推荐)

这个方案的核心思想就是如果一个集合是另一个集合的连续子序列,那么这两个集合序列化成字符串应该也还会有这样的特性,即一个字符串包含了另一个字符串。我立马想到了用string.Join把数组拼接成字符串,具体代码实现如下:

public static bool IsSubsequenceJoin(IEnumerable<string> main, IEnumerable<string> sub)
{
var mainString = string.Join(",", main);
var subString = string.Join(",", sub);
return mainString.Contains(subString);
}

其实听到序列化我第一反应是感觉有坑的,因为序列化会涉及到一些特殊字符的问题,还记得我之前的文章《“hello”.IndexOf(“\0”,2)中的坑》吗,就是因为特殊字符串引起。

当然上面的方法应对大多数需求应该没问题,但是还是有些特例需要注意,比如下面这个例子:

string[] main = ["a", "b", "c", "d,e"];
string[] sub = ["d", "e"];
var isSubsequenceJoin = ContinuousSubsequence.IsSubsequenceJoin(main, sub);
Console.WriteLine("数组 [\"a\", \"b\", \"c\", \"d,e\"] 序列化后: " + string.Join(",", main));
Console.WriteLine("数组 [\"d\", \"e\"] 序列化后: " + string.Join(",", sub));
Console.WriteLine("mainString.Contains(subString) 结果: " + isSubsequenceJoin);

运行结果如下:

因为string.Join使用了“,“作为拼接,所以sub数组序列化后就是"d,e",而数组main中恰好有个元素"d,e",这就导致预期之外的错误结果。

既然string.Join方法有缺陷还有其他序列化方法吗?我们试试专门做序列化的方法JsonConvert.SerializeObject,代码如下:

public static bool IsSubsequenceSerialize(IEnumerable<string> main, IEnumerable<string> sub)
{
var mainString = JsonConvert.SerializeObject(main).TrimStart('[').TrimEnd(']');
var subString = JsonConvert.SerializeObject(sub).TrimStart('[').TrimEnd(']');
return mainString.Contains(subString);
}

这个方法需要我们处理一些序列化产生的额外结构数据,比如上面的TrimStart('[').TrimEnd(']'),就是为了去掉数组产生的额外字符,如果要是其他更复杂类型可以要考虑的情况更多。

当然这个方法就可以解决上面的特例问题,但是依然有些特殊情况会导致错误,比如下面的示例:

string[] main = ["a", "b", "c", "d,\"e"];
string[] sub = ["e"];
var isSubsequenceSerialize = ContinuousSubsequence.IsSubsequenceSerialize(main, sub);
Console.WriteLine("IsSubsequenceSerialize 方法: ");
Console.WriteLine("数组 main [\"a\", \"b\", \"c\", \"d,\\\"e\"] 序列化后: " + JsonConvert.SerializeObject(main).TrimStart('[').TrimEnd(']'));
Console.WriteLine("数组 sub [\"e\"] 序列化后: " + JsonConvert.SerializeObject(sub).TrimStart('[').TrimEnd(']'));
Console.WriteLine("mainString.Contains(subString) 结果: " + isSubsequenceSerialize);

结果如下:

这个例子因为我们在构建数组main时,在一个元素中多加了一个符合[ “ ],使得结果出现预期之外的错误结果。

因此对于序列化字符串方式在大多数情况下都是不推荐使用的,除非你能保证你的数据不会出现一些特殊情况,如果数量大可能还会有性能问题。

02解法二:滑动窗口(推荐)

我们简单解释一下滑动窗口算法是啥意思,先看一下下面这张图感受一下。

滑动窗口可以理解成在一个长轴上,滑动一个窗口,因为窗口大小是固定的,所以随着时间推移,从窗口中看到的东西是不一样的。

把我们的问题和上图结合起来看,如果主数组main代表长轴,子数组sub代表窗口,现在我们把子数组窗口对齐主数组起始位置,然后时间轴每前进一个刻度代表子数组沿着主数组向前移动一位数。

当时间刻度来到T2时,从子数组窗口中可以看到数组[1,3,5],当时间刻度来到T8时,从子数组窗口中可以看到数组[8,7,6]。

也就是说随着时间的推进,当子数组窗口中看到的数组和自身数组值一样时,则代表子数组是主数组的连续子序列。具体实现代码如下:

public static bool IsSubsequenceSlidingWindow<T>(IEnumerable<T> main, IEnumerable<T> sub)
{
var mainLength = main.Count();
var subLength = sub.Count();
for (int i = 0; i < mainLength - subLength + 1; i++)
{
var expect = main.Skip(i).Take(subLength);
if (expect.SequenceEqual(sub))
{
return true;
}
}
return false;
}

注: 相关源码都已经上传至代码库,有兴趣的可以看看。

https://gitee.com/hugogoos/Planner

C#|.net core 基础 - 如何判断连续子序列的更多相关文章

  1. POJ-最大连续子序列和

    给定一个整数序列,找到一个具有最大和的连续子序列(子序列最少包含一个元素),返回其最大和. 实例输入: -2, 1, -3, 4, -1, 2, 1, -5, 4 实例输出: 6(连续子序列4, -1 ...

  2. 【基础练习】【线性DP】codevs2622 数字序列(最大连续子序列和)题解

    版权信息 转载请注明出处 [ametake版权全部]http://blog.csdn.net/ametake欢迎来看 这道题目本质就是朴素的最大连续子序列和 直接上题目和代码 题目描写叙述 Descr ...

  3. 最大连续子序列乘积(DP)

    题目来源:小米手机2013年校园招聘笔试题 题目描述: 给定一个浮点数序列(可能有正数.0和负数),求出一个最大的连续子序列乘积. 输入: 输入可能包含多个测试样例.每个测试样例的第一行仅包含正整数 ...

  4. hdoj 1231 最大连续子序列

    最大连续子序列 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Sub ...

  5. dp经典问题-最大连续子序列和 hdu1003

    题目描述: 这道题我先后做过三遍,结果每一遍都没有做出来.今天再仔仔细细的研究了一下,才发现用动态规划更好理解. 关于求最大连续子序列和的博文转载如下:https://www.cnblogs.com/ ...

  6. hdu1003 Max Sum【最大连续子序列之和】

    题目链接:https://vjudge.net/problem/HDU-1003 题目大意:给出一段序列,求出最大连续子序列之和,以及给出这段子序列的起点和终点. 解题思路:最长连续子序列之和问题其实 ...

  7. HDU——最大连续子序列(区间DP)

    上一个题的加强版! 最大连续子序列 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others ...

  8. 题解报告:hdu1231最大连续子序列

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1231 Problem Description 给定K个整数的序列{ N1, N2, ..., NK } ...

  9. ASP.NET Core 登录登出 - ASP.NET Core 基础教程 - 简单教程,简单编程

    原文:ASP.NET Core 登录登出 - ASP.NET Core 基础教程 - 简单教程,简单编程 ASP.NET Core 登录登出 上一章节我们总算完善了注册的功能,而且也添加了一个用户,现 ...

  10. HDU 1231 最大连续子序列 (动态规划)

    最大连续子序列 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Sub ...

随机推荐

  1. 使用gitea搭建源码管理【0到1架构系列】

    使用开源搭建Git源码方案,gitlab和gitea是两个不错的方案,gitlab以前简单易用,现在功能复杂且对开源并不友好,gitea一直保持功能单一易用且完全开源,个人推荐gitea. 通过容器安 ...

  2. yb课堂之用户登陆校验拦截器开发 《十一》

    开发对应的登陆拦截器 开发loginInterceptor 登陆校验成功放行 登陆不成功返回json数据 LoginInterceptor.java package net.ybclass.onlin ...

  3. MySQL 索引失效

    全列匹配 最佳左前缀法则 不在索引列上做任何操作(计算.函数.自动.手动类型转换),会导致索引失效 存储引擎不能使用索引中范围条件右边的列 尽量使用覆盖索引(只访问索引的查询(索引和查询列一致)),少 ...

  4. 使用FModel提取游戏资产

    目录 前言 FModel简介 FModel安装 FModel使用 初次使用 资产预览 资产导出 附录 dumper Dumper-7生成usmap文件 向游戏中注入dll 前言 这篇文章仅记录我作为初 ...

  5. Swift开发基础08-高阶函数

    高阶函数是指接受其它函数作为参数,或者返回其它函数的函数.Swift 提供了许多内置的高阶函数,这些函数在处理集合类型数据(如数组.集合等)时尤其有用.常见的高阶函数包括 map.filter.red ...

  6. iOS开发基础143-性能优化

    我们可以先构建一个详细的大纲,然后在每个部分详细阐述.下面是一个针对iOS性能优化的详细大纲: 一. App启动时间优化 A. 启动分类 冷启动 热启动 B. 冷启动优化 减少启动时的动态库加载 尽可 ...

  7. C++命名空间、标准输入输出、引用

    1.简述C++中命名空间的作用. 答:避免重复定义全局变量的问题. 2.定义两个命名空间A 和 B 分别在A中和B中定义变量value.在main函数中将两个空间的value打印出来. #includ ...

  8. [SDR] GNU Radio 系列教程 —— GNU Radio TX PDU (发送数据包操作)的基础知识(超全)

    目录 1 PDU 概述 2 Demo 详解 2.1 Random PDU Generator 2.2 Async CRC32 2.3 Protocol Formatter (Async) 2.4 将 ...

  9. GeoScene Enterprise 3.1 临时许可更新

    Portal许可更新 portal 的许可更新很简单,直接打开Portal在线更新就好了 平台管理 -> 许可管理 -> 附加许可 -> 导入许可 -> 选择文件(选择授权的j ...

  10. 【转载】 推荐算法之Thompson(汤普森)采样

    原文地址: https://www.cnblogs.com/gczr/p/11220187.html ------------------------------------------------- ...