C#|.net core 基础 - 如何判断连续子序列
前两天同事遇到了一个小需求,想判断一个集合是不是在另一个集合中存在,并且要求顺序一致,然后一起讨论了下应该怎么做,有没有什么比较好的方式?下面分享一下我们想到的方法,如果你也有不同的想法也可以分享给我。
01解法一:序列化字符串(不推荐)
这个方案的核心思想就是如果一个集合是另一个集合的连续子序列,那么这两个集合序列化成字符串应该也还会有这样的特性,即一个字符串包含了另一个字符串。我立马想到了用string.Join把数组拼接成字符串,具体代码实现如下:
public static bool IsSubsequenceJoin(IEnumerable<string> main, IEnumerable<string> sub)
{
var mainString = string.Join(",", main);
var subString = string.Join(",", sub);
return mainString.Contains(subString);
}
其实听到序列化我第一反应是感觉有坑的,因为序列化会涉及到一些特殊字符的问题,还记得我之前的文章《“hello”.IndexOf(“\0”,2)中的坑》吗,就是因为特殊字符串引起。
当然上面的方法应对大多数需求应该没问题,但是还是有些特例需要注意,比如下面这个例子:
string[] main = ["a", "b", "c", "d,e"];
string[] sub = ["d", "e"];
var isSubsequenceJoin = ContinuousSubsequence.IsSubsequenceJoin(main, sub);
Console.WriteLine("数组 [\"a\", \"b\", \"c\", \"d,e\"] 序列化后: " + string.Join(",", main));
Console.WriteLine("数组 [\"d\", \"e\"] 序列化后: " + string.Join(",", sub));
Console.WriteLine("mainString.Contains(subString) 结果: " + isSubsequenceJoin);
运行结果如下:
因为string.Join使用了“,“作为拼接,所以sub数组序列化后就是"d,e",而数组main中恰好有个元素"d,e",这就导致预期之外的错误结果。
既然string.Join方法有缺陷还有其他序列化方法吗?我们试试专门做序列化的方法JsonConvert.SerializeObject,代码如下:
public static bool IsSubsequenceSerialize(IEnumerable<string> main, IEnumerable<string> sub)
{
var mainString = JsonConvert.SerializeObject(main).TrimStart('[').TrimEnd(']');
var subString = JsonConvert.SerializeObject(sub).TrimStart('[').TrimEnd(']');
return mainString.Contains(subString);
}
这个方法需要我们处理一些序列化产生的额外结构数据,比如上面的TrimStart('[').TrimEnd(']'),就是为了去掉数组产生的额外字符,如果要是其他更复杂类型可以要考虑的情况更多。
当然这个方法就可以解决上面的特例问题,但是依然有些特殊情况会导致错误,比如下面的示例:
string[] main = ["a", "b", "c", "d,\"e"];
string[] sub = ["e"];
var isSubsequenceSerialize = ContinuousSubsequence.IsSubsequenceSerialize(main, sub);
Console.WriteLine("IsSubsequenceSerialize 方法: ");
Console.WriteLine("数组 main [\"a\", \"b\", \"c\", \"d,\\\"e\"] 序列化后: " + JsonConvert.SerializeObject(main).TrimStart('[').TrimEnd(']'));
Console.WriteLine("数组 sub [\"e\"] 序列化后: " + JsonConvert.SerializeObject(sub).TrimStart('[').TrimEnd(']'));
Console.WriteLine("mainString.Contains(subString) 结果: " + isSubsequenceSerialize);
结果如下:
这个例子因为我们在构建数组main时,在一个元素中多加了一个符合[ “ ],使得结果出现预期之外的错误结果。
因此对于序列化字符串方式在大多数情况下都是不推荐使用的,除非你能保证你的数据不会出现一些特殊情况,如果数量大可能还会有性能问题。
02解法二:滑动窗口(推荐)
我们简单解释一下滑动窗口算法是啥意思,先看一下下面这张图感受一下。
滑动窗口可以理解成在一个长轴上,滑动一个窗口,因为窗口大小是固定的,所以随着时间推移,从窗口中看到的东西是不一样的。
把我们的问题和上图结合起来看,如果主数组main代表长轴,子数组sub代表窗口,现在我们把子数组窗口对齐主数组起始位置,然后时间轴每前进一个刻度代表子数组沿着主数组向前移动一位数。
当时间刻度来到T2时,从子数组窗口中可以看到数组[1,3,5],当时间刻度来到T8时,从子数组窗口中可以看到数组[8,7,6]。
也就是说随着时间的推进,当子数组窗口中看到的数组和自身数组值一样时,则代表子数组是主数组的连续子序列。具体实现代码如下:
public static bool IsSubsequenceSlidingWindow<T>(IEnumerable<T> main, IEnumerable<T> sub)
{
var mainLength = main.Count();
var subLength = sub.Count();
for (int i = 0; i < mainLength - subLength + 1; i++)
{
var expect = main.Skip(i).Take(subLength);
if (expect.SequenceEqual(sub))
{
return true;
}
}
return false;
}
注: 相关源码都已经上传至代码库,有兴趣的可以看看。
https://gitee.com/hugogoos/Planner
C#|.net core 基础 - 如何判断连续子序列的更多相关文章
- POJ-最大连续子序列和
给定一个整数序列,找到一个具有最大和的连续子序列(子序列最少包含一个元素),返回其最大和. 实例输入: -2, 1, -3, 4, -1, 2, 1, -5, 4 实例输出: 6(连续子序列4, -1 ...
- 【基础练习】【线性DP】codevs2622 数字序列(最大连续子序列和)题解
版权信息 转载请注明出处 [ametake版权全部]http://blog.csdn.net/ametake欢迎来看 这道题目本质就是朴素的最大连续子序列和 直接上题目和代码 题目描写叙述 Descr ...
- 最大连续子序列乘积(DP)
题目来源:小米手机2013年校园招聘笔试题 题目描述: 给定一个浮点数序列(可能有正数.0和负数),求出一个最大的连续子序列乘积. 输入: 输入可能包含多个测试样例.每个测试样例的第一行仅包含正整数 ...
- hdoj 1231 最大连续子序列
最大连续子序列 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Sub ...
- dp经典问题-最大连续子序列和 hdu1003
题目描述: 这道题我先后做过三遍,结果每一遍都没有做出来.今天再仔仔细细的研究了一下,才发现用动态规划更好理解. 关于求最大连续子序列和的博文转载如下:https://www.cnblogs.com/ ...
- hdu1003 Max Sum【最大连续子序列之和】
题目链接:https://vjudge.net/problem/HDU-1003 题目大意:给出一段序列,求出最大连续子序列之和,以及给出这段子序列的起点和终点. 解题思路:最长连续子序列之和问题其实 ...
- HDU——最大连续子序列(区间DP)
上一个题的加强版! 最大连续子序列 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others ...
- 题解报告:hdu1231最大连续子序列
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1231 Problem Description 给定K个整数的序列{ N1, N2, ..., NK } ...
- ASP.NET Core 登录登出 - ASP.NET Core 基础教程 - 简单教程,简单编程
原文:ASP.NET Core 登录登出 - ASP.NET Core 基础教程 - 简单教程,简单编程 ASP.NET Core 登录登出 上一章节我们总算完善了注册的功能,而且也添加了一个用户,现 ...
- HDU 1231 最大连续子序列 (动态规划)
最大连续子序列 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Sub ...
随机推荐
- Java开发环境配置(IDEA系列)
一.IDEA安装和破解,JDK1.8 以上或JDK 16 下一步下一步,安装jdk配置环境变量: 二.Maven安装 和IDEA集成Maven IDEA 配置 Maven 环境 1.选择 IDEA中 ...
- Mysql-explain之Using temporary和Using filesort解决方案
第一条语句 explainselect * from tb_wm_shop where is_delete != 1 and is_authentication = 1 ORDER BY create ...
- [oeasy]python0143_主控程序_main
主控程序 回忆上次内容 上次把 apple.py 拆分成了 输入 主函数 引用模块中变量的时候 要带上包(module)名 get_fruits.a get_fruits.b 最终 拆分代 ...
- 全网最适合入门的面向对象编程教程:20 类和对象的 Python 实现-组合关系的实现与 CSV 文件保存
全网最适合入门的面向对象编程教程:20 类和对象的 Python 实现-组合关系的实现与 CSV 文件保存 摘要: 本文主要介绍了在使用 Python 面向对象编程时,如何实现组合关系,同时对比了组合 ...
- Langchain 与 LlamaIndex:LLM 应用开发框架的比较与使用建议
Langchain 和 Llamaindex 是两种广泛使用的主流 LLM 应用开发框架.两者有什么不同?我们该如何使用?以下我根据各类资料和相关文档做了初步选型. 一.Langchain 1. 适用 ...
- ComfyUI进阶:Comfyroll插件 (五)
ComfyUI进阶:Comfyroll插件 (五) 前言: 学习ComfyUI是一场持久战,而Comfyroll 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业 ...
- C# 对象复制三种方法效率对比——反射、序列化、表达式树
1.需求 在代码中经常会遇到需要把对象复制一遍,或者把属性名相同的值复制一遍. 比如: public class Student { public int Id { get; set; } publi ...
- 从DDPM到DDIM (一) 极大似然估计与证据下界
从DDPM到DDIM (一) 极大似然估计与证据下界 现在网络上关于DDPM和DDIM的讲解有很多,但无论什么样的讲解,都不如自己推到一遍来的痛快.笔者希望就这篇文章,从头到尾对扩散模型做一次完整 ...
- mysql密码的初始化,修改与重置
目录 mysql密码的初始化,修改与重置 郑重说明: 初始化密码(第一次使用前要初始化密码) 查看密码(已登录状态) 修改密码(已知原密码) 忘记密码(密码找回) 诺mysql装在Windows 诺m ...
- 【Java】JDBC Part5 DataSource 连接池操作
JDBC Part5 DataSource 连接池操作 - javax.sql.DataSource 接口,通常由服务器实现 - DBCP Tomcat自带相对C3P0速度较快,但存在BUG,已经不更 ...