题目:

给定一个表示代码片段的字符串,你需要实现一个验证器来解析这段代码,并返回它是否合法。合法的代码片段需要遵守以下的所有规则:

  1. 代码必须被合法的闭合标签包围。否则,代码是无效的。
  2. 闭合标签(不一定合法)要严格符合格式:<TAG_NAME>TAG_CONTENT</TAG_NAME>。其中,<TAG_NAME>是起始标签,</TAG_NAME>是结束标签。起始和结束标签中的 TAG_NAME 应当相同。当且仅当 TAG_NAME 和 TAG_CONTENT 都是合法的,闭合标签才是合法的。
  3. 合法的 TAG_NAME 仅含有大写字母,长度在范围 [1,9] 之间。否则,该 TAG_NAME 是不合法的。
  4. 合法的 TAG_CONTENT 可以包含其他合法的闭合标签,cdata (请参考规则7)和任意字符(注意参考规则1)除了不匹配的<、不匹配的起始和结束标签、不匹配的或带有不合法 TAG_NAME 的闭合标签。否则,TAG_CONTENT 是不合法的。
  5. 一个起始标签,如果没有具有相同 TAG_NAME 的结束标签与之匹配,是不合法的。反之亦然。不过,你也需要考虑标签嵌套的问题。
  6. 一个<,如果你找不到一个后续的>与之匹配,是不合法的。并且当你找到一个<或</时,所有直到下一个>的前的字符,都应当被解析为 TAG_NAME(不一定合法)。
  7. cdata 有如下格式:<![CDATA[CDATA_CONTENT]]>。CDATA_CONTENT 的范围被定义成 <![CDATA[ 和后续的第一个 ]]>之间的字符。
  8. CDATA_CONTENT 可以包含任意字符。cdata 的功能是阻止验证器解析CDATA_CONTENT,所以即使其中有一些字符可以被解析为标签(无论合法还是不合法),也应该将它们视为常规字符。

合法代码的例子:

输入: "<DIV>This is the first line <![CDATA[<div>]]></DIV>"

输出: True

解释:

代码被包含在了闭合的标签内: <DIV> 和 </DIV> 。

TAG_NAME 是合法的,TAG_CONTENT 包含了一些字符和 cdata 。

即使 CDATA_CONTENT 含有不匹配的起始标签和不合法的 TAG_NAME,它应该被视为普通的文本,而不是标签。

所以 TAG_CONTENT 是合法的,因此代码是合法的。最终返回True。

输入: "<DIV>>> ![cdata[]] <![CDATA[<div>]>]]>]]>>]</DIV>"

输出: True

解释:

我们首先将代码分割为: start_tag|tag_content|end_tag 。

start_tag -> "<DIV>"

end_tag -> "</DIV>"

tag_content 也可被分割为: text1|cdata|text2 。

text1 -> ">> ![cdata[]] "

cdata -> "<![CDATA[<div>]>]]>" ,其中 CDATA_CONTENT 为 "<div>]>"

text2 -> "]]>>]"

start_tag 不是 "<DIV>>>" 的原因参照规则 6 。
cdata 不是 "<![CDATA[<div>]>]]>]]>" 的原因参照规则 7 。
不合法代码的例子:

输入: "<A> <B> </A> </B>"
输出: False
解释: 不合法。如果 "<A>" 是闭合的,那么 "<B>" 一定是不匹配的,反之亦然。

输入: "<DIV> div tag is not closed <DIV>"
输出: False

输入: "<DIV> unmatched < </DIV>"
输出: False

输入: "<DIV> closed tags with invalid tag name <b>123</b> </DIV>"
输出: False

输入: "<DIV> unmatched tags with invalid tag name </1234567890> and <CDATA[[]]> </DIV>"
输出: False

输入: "<DIV> unmatched start tag <B> and unmatched end tag </C> </DIV>"
输出: False
注意:

为简明起见,你可以假设输入的代码(包括提到的任意字符)只包含数字, 字母, '<','>','/','!','[',']'和' '。

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/tag-validator
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

解题思路:

这题的题目实在是太太太长了,参考@宫水三叶的题解以及其他大佬的题解,梳理一下思路~,感觉自己有所成长,一步一步分析,有些代码有所变换,也能一步一步试错进行通过啦(:

仍然使用栈的特点来解题

1.使用栈来存储有效的左标签,并在找到右标签时与栈顶的左标签进行比较。

2.遍历遇到 <时,根据遇到的是左标签<TAG_NAME>、右标签</TAG_NAME>、cdata<![CDATA[任意字符]]>分情况讨论:

  • 遇到的是左标签:检查名字是否均为大写字母且长度在[1,9],不符合条件就返回false,符合条件就压栈,等待与之匹配的右标签;
  • 遇到的是右标签:将其与栈顶元素进行匹配,若栈为空或者不匹配,返回false,匹配后栈顶元素出栈;
  • 遇到的是cdata:检查当前连续段是否为cdata,若能匹配到开头--"<![CDATA[",则尝试匹配到cdata的结尾 "]]>",若无法找到结尾,返回 false

3.遍历完后,判断栈是否为空,来返回是true还是fasle。

代码:

 1 class Solution {
2 public boolean isValid(String code) {
3 int n = code.length();
4 if(code == null || n == 0) return false;
5 Deque<String> stack = new ArrayDeque<>();
6 //不在这里变化i的原因:每一个判断中i的变化分情况讨论
7 for(int i = 0; i < n; ){
8 if(code.charAt(i) == '<'){
9 //如果这时<已经在末位置
10 if(i == n - 1){
11 return false;
12 }else if(code.charAt(i+1) == '/'){
13 //如果这时候为末标签
14 //从i处开始检索 > 首次出现的位置
15 //</TAG> i对应< j对应>
16 int j = code.indexOf('>', i);
17 //未找到返回-1
18 if(j == -1) return false;
19 //找到了就去栈中判断是否有对应的首标签
20 String tag = code.substring(i + 2, j);
21 if(stack.isEmpty() || !stack.peekLast().equals(tag)){
22 return false;
23 }
24 //匹配成功,就将该首标签弹出栈
25 stack.pollLast();
26 //更新i的位置
27 i = j + 1;
28 //如果这时栈空且未达到末位置也为fasle
29 if(stack.isEmpty() && i != n) return false;
30 }else if(code.charAt(i + 1) == '!'){
31 //这时候为cdata
32 //cdata = <![CDATA[任意内容]]>
33 //如果这时候占位空,就没标签包含cdata
34 if(stack.isEmpty()) return false;
35 //<![CDATA[ 长度为9
36 if(i + 9 > n) return false;
37 //取出感叹号后面的7个字符
38 String cdata1 = code.substring(i + 2, i + 9);
39 if(!"[CDATA[".equals(cdata1)) return false;
40 //找到 ]]> 的位置
41 int j = code.indexOf("]]>", i);
42 if(j == -1) return false;
43 i = j + 3;
44 }else{
45 //首标签,i对应< , j对应>
46 int j = code.indexOf('>', i);
47 //判断标签中名字长度的合法性
48 if(j < 0 || j - i - 1 < 1 || j - i - 1 > 9) return false;
49 //判断标签中名字是否全为大写字母
50 for(int k = i + 1; k < j; k++){
51 if(!Character.isUpperCase(code.charAt(k))){
52 return false;
53 }
54 }
55 //将首标签压栈
56 stack.addLast(code.substring(i + 1, j));
57 //更新i
58 i = j + 1;
59 }
60 }else{
61 //如果不为 <,说明是其他字符,栈中就应该有首标签
62 if(stack.isEmpty()) return false;
63 //接着下一个字符进行遍历
64 i++;
65 }
66 }
67 return stack.isEmpty();
68 }
69 }

小知识:

1.indexOf() 方法可返回某个指定的字符串值在字符串中首次出现的位置。注意:该方法对大小写敏感!

stringObject.indexOf( value, index );

参数:

value:必需,规定需检索的字符串值。可选的整数参数。

index:规定在字符串中开始检索的位置。它的合法取值是 0 到 stringObject.length - 1。如省略该参数,则将从字符串的首字符开始检索。该方法将从头到尾地检索字符串 stringObject,看它是否含有子串 value。开始检索的位置在字符串的 index 处或字符串的开头(没有指定 index 时)。stringObject 中的字符位置是从 0 开始的,如果找到一个 value,则返回 value 的第一次出现的位置。如果没找到,则返回-1。

2.substring(int beginIndex, int endIndex):返回从起始位置到目标位置直接的字符串,不包含目标位置。(左闭右开区间)。

力扣591(java)-标签验证器(困难)的更多相关文章

  1. [Swift]LeetCode591. 标签验证器 | Tag Validator

    Given a string representing a code snippet, you need to implement a tag validator to parse the code ...

  2. [LeetCode] Tag Validator 标签验证器

    Given a string representing a code snippet, you need to implement a tag validator to parse the code ...

  3. 力扣(LeetCode)验证回文串 个人题解(C++)

    给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,可以忽略字母的大小写. 说明:本题中,我们将空字符串定义为有效的回文串. 示例 1: 输入: "A man, a plan, a c ...

  4. 力扣(LeetCode)验证回文串 个人题解

    给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,可以忽略字母的大小写. 说明:本题中,我们将空字符串定义为有效的回文串. 示例 1: 输入: "A man, a plan, a c ...

  5. 力扣(LeetCode)验证回文字符串II 个人题解

    给定一个非空字符串 s,最多删除一个字符.判断是否能成为回文字符串. 示例 1: 输入: "aba" 输出: True 示例 2: 输入: "abca" 输出: ...

  6. 原生JS 表单提交验证器

    转载:http://www.cnblogs.com/sicd/p/4613628.html 一.前言 最近在开发一个新项目,需要做登陆等一系列的表单提交页面.在经过“缜密”的讨论后,我们决定 不用外部 ...

  7. JS表单原生验证器

    一.前言 最近在开发一个新项目,需要做登陆等一系列的表单提交页面.在经过“缜密”的讨论后,我们决定 不用外部流行的框架,如bootstrap,由于我负责的模块 仅仅是其中的一部分,因此少数服从多数,无 ...

  8. 实现一个可配置的java web 参数验证器

    当使用java web的servlet来做接口的时候,如果严格一点,经常会对请求参数做一些验证并返回错误码.我发现通常参数验证的代码就在servlet里边,如果参数不正确就返回相应的错误码.如果接口数 ...

  9. 两步验证杀手锏:Java 接入 Google 身份验证器实战

    两步验证 大家应该对两步验证都熟悉吧?如苹果有自带的两步验证策略,防止用户账号密码被盗而锁定手机进行敲诈,这种例子屡见不鲜,所以苹果都建议大家开启两步验证的. Google 的身份验证器一般也是用于登 ...

  10. 力扣算法经典第一题——两数之和(Java两种方式实现)

    一.题目 难度:简单 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数, 并返回它们的数组下标. 你可以假设每种输入只会对应一 ...

随机推荐

  1. Nordic芯片调研简析

    一 公司简介: Nordic semiconductor是一家在奥斯证券交易所(OSX:NOD)上市的挪威无晶圆厂半导体公司,专门研究IoT的无线技术.Nordic的声誉建立在领先的技术和开发工具之上 ...

  2. 15_AAC编码实战

    本文将分别通过命令行.编程2种方式进行AAC编码实战,使用的编码库是libfdk_aac. 要求 fdk-aac对输入的PCM数据是有参数要求的,如果参数不对,就会出现以下错误: [libfdk_aa ...

  3. 10_PCM转WAV

    播放器是无法直接播放PCM的,因为播放器并不知道PCM的采样率.声道数.位深度等参数.当PCM转成某种特定的音频文件格式后(比如转成WAV),就能够被播放器识别播放了. 本文通过2种方式(命令行.编程 ...

  4. .NET Core使用 CancellationToken 取消API请求

    您是否曾经访问过一个网站,它需要很长时间加载,最终你敲击 F5 重新加载页面. 即使用户刷新了浏览器取消了原始请求,而对于服务器来说,API也不会知道它正在计算的值将在结束时被丢弃,刷新五次,服务器将 ...

  5. 实时云渲染技术_如何助力VR虚拟现实走向成熟?

    近年来,虚拟现实(Virtual Reality, VR)技术在市场上的应用越来越广泛,虚拟现实已成为一个热门的科技话题.相关数据显示,2019年至2021年,我国虚拟现实市场规模不断扩大,从2019 ...

  6. 记录--7 个沙雕又带有陷阱的 JS 面试题

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 为了保证的可读性,本文采用意译而非直译. 在 JS 面试中,经常会看到一些简单而又沙雕的题目,这些题目包含一些陷阱,但这些在我们规范的编码 ...

  7. 记录--两行CSS让页面提升了近7倍渲染性能!

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 对于前端人员来讲,最令人头疼的应该就是页面性能了,当用户在访问一个页面时,总是希望它能够快速呈现在眼前并且是可交互状态.如果页面加载 ...

  8. Vue中点击按钮回到顶部(滚动效果)

    页面滚动到一定位置时,出现回到顶部按钮 代码如下HTML <div class="footer"> <div class="gotop" v- ...

  9. nginx location块

    location块在server块中使用,它的作用是根据客户端请求URL去定位不同的应用. 匹配格式 作用 location = /uri = 表示精确匹配,只有完全匹配上才能生效 location ...

  10. read IEEE Standard for verilog(1)

    IEEE Standard for Verilog Hardware Description Language 英语说明阅读,首先看导读.目录.摘要等内容. 摘要: 1 Abstract: The V ...