HDU 4782 Beautiful Soup （模拟+注意细节）

思路就是用栈模拟，不用开实体的栈，直接记一个top指针就行。

说说这题的细节：

1.tag标签里的内容不要动，原样输出。比如<p aa bb cc>，就这样输出就行，不要删空格。题目中说了you shouldn’t change anything of any tag.

2.标签之外的文本，文本内的空白符（空格，tab，回车），相邻单词之间用一个空格分隔开。文本与标签相邻的地方，不要有多余的空白符，就是说，文本与标签相邻的地方，除了一个回车以及缩进用的空白符之外，不要有任何空白符。

3.上一个case的</html>跟下一个case的<html>有可能在同一行，并且第一个<html>之前有可能有空白符

4.每行结尾不要有多余的空格

5.不要有空行

以下给出几组数据，空格用<SPACE>表示,tab键用<TAB>表示：

Input:

<TAB><html>                <body>

<h1>ACM

ICPC</h1>

<p>Hello<br/>World</p>

</body></html>

<html>            <body><p><TAB>

Asia Chengdu Regional        </p><TAB>

        <p class="icpc">

ACM-ICPC</p></body></html>

<html>          <TAB>

<TAB>

</html><TAB><html>

<p>

   <TAB>

       aa bb          cc

dafdadgsdfsa<TAB>

afd

     </p>

   <TAB>   </html><TAB><TAB>

<html><body aslfja        fdsafs<TAB>fdsafsa  ><bb/></body></html>

Output

Case #:

<html>

 <body>

  <h1>

   ACM ICPC

  </h1>

  <p>

   Hello

   <br/>

   World

  </p>

 </body>

</html>

Case #:

<html>

 <body>

  <p>

   Asia Chengdu Regional

  </p>

  <p class="icpc">

   ACM-ICPC

  </p>

 </body>

</html>

Case #:

<html>

</html>

Case #:

<html>

 <p>

  aa bb cc dafdadgsdfsa afd

 </p>

</html>

Case #:

<html>

 <body aslfja        fdsafs    fdsafsa  >

  <bb/>

 </body>

</html>

代码

#include <cstdio>

#include <cstring>

#include <cstdlib>

#define IN 0

#define OUT 1

#define START 0

#define END 1

using namespace std;

const int MAXN = ;

char str[MAXN];

char tmp[MAXN];

char tag[MAXN];

bool CheckEnd( char *s, int len )

{

    if ( s[len-] == '<' && s[len-] == '/' && s[len-] == 'h'

      && s[len-] == 't' && s[len-] == 'm' && s[len-] == 'l'

      && s[len] == '>' )

      return true;

    return false;

}

int chuli( char *s, int len )

{

    int i = , j = ;

    while ( i < len && (s[i] == ' ' || s[i] ==  || s[i] == '\n') ) ++i;

    while ( i < len )

    {

        s[j] = s[i];

        if ( s[i] == '>' )

        {

            ++i;

            while ( s[i] == ' ' || s[i] ==  || s[i] == '\n' ) ++i;

        }

        else ++i;

        ++j;

    }

    s[j] = '\0';

    return j;

}

int DeleteSpace( char *s, int len )

{

    int i = , j = ;

    while ( i < len )

    {

        if ( s[i] == '<' )

        {

            if ( j -  >=  && ( s[j - ] == ' ' || s[j - ] ==  ) ) s[j - ] = s[i++];

            while ( i < len && s[i] != '>' )

            {

                s[j++] = s[i++];

            }

            s[j++] = s[i++];

        }

        else if ( s[i] == ' ' || s[i] ==  )

        {

            s[j++] = ' ';

            while ( i < len && ( s[i] == ' ' || s[i] ==  ) ) ++i;

        }

        else s[j++] = s[i++];

    }

    s[j] = '\0';

    return j;

}

void solved( char* s, int len )

{

    //puts(s);

    int top = ;

    int i = ;

    while ( i < len )

    {

        if ( s[i] == '<' )

        {

            int j = ;

            while ( s[i] != '>' )

            {

                tag[j++] = s[i++];

            }

            tag[j++] = s[i++];

            tag[j] = '\0';

            if ( tag[] == '/' )

            {

                --top;

                for ( int k = ; k < top; ++k )

                    putchar(' ');

            }

            else

            {

                for ( int k = ; k < top; ++k )

                    putchar(' ');

                ++top;

            }

            if ( tag[j-] == '/' ) --top;

            puts(tag);

        }

        else

        {

            for ( int k = ; k < top; ++k ) putchar(' ');

            while ( i < len && s[i] != '<' )

            {

                putchar(s[i]);

                ++i;

            }

            puts("");

        }

    }

    return;

}

int main()

{

    int T, cas = ;

    //freopen( "in.txt", "r", stdin );

    //freopen( "s.txt", "w", stdout );

    scanf( "%d", &T );

    printf( "Case #%d:\n", ++cas );

    int len = ;

    while ( gets(tmp) != NULL )

    {

        strcpy( &str[len], tmp );

        len += strlen(tmp);

        str[len++] = ' ';

    }

    str[len - ] = '\0';

    //puts(str);

    int j = ;

    for ( int i = ; i < len; )

    {

        tmp[j++] = str[i++];

        if ( j >  && CheckEnd( tmp, j -  ) )

        {

            tmp[j] = '\0';

            --T;

            //printf( "T = %d\n", T );

            solved( tmp, DeleteSpace( tmp, chuli( tmp, j ) ) );

            j = ;

            if ( T ) printf( "Case #%d:\n", ++cas );

        }

    }

    return ;

}

HDU 4782 Beautiful Soup （模拟+注意细节）的更多相关文章

HDU 4782 Beautiful Soup --模拟
题意: 将一些分散在各行的HTML代码整理成标签树的形式. 解法: 模拟,具体见代码的讲解. 开始没考虑 '\t' .. 代码: #include <iostream> #include ...
hdu - 4782 - Beautiful Soup（模拟）
题意:输出一堆乱排版的html标签,去多余空字符,转换为按缩进输出. 题目链接:pid=4782">http://acm.hdu.edu.cn/showproblem.php?pid= ...
hdu 4782 Beautiful Soupz
模拟.其实这题就是题目比较长而已...读完题目就差不多了.tag直接读就可以了,题目说了不用修改.然后整个题目就是让求text部分,严格按空格分开.注意每行前面空格个数. #include<al ...
推荐一些python Beautiful Soup学习网址
前言:这几天忙着写分析报告,实在没精力去研究django,虽然抽时间去看了几遍中文文档,还是等实际实践后写几篇操作文章吧! 正文:以下是本人前段时间学习bs4库找的一些网址,在学习的可以参考下,有点多 ...
转：Beautiful Soup
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时 ...
python爬虫之Beautiful Soup的基本使用
1.简介简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据.官方解释如下: Beautiful Soup提供一些简单的.python式的函数用来处理导航.搜索 ...
Beautiful Soup 学习手册
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式快速开始下面的一段HTML代码将作为例 ...
Beautiful Soup 4.2.0 文档
Beautiful Soup 4.2.0 文档 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方 ...
100天搞定机器学习|Day21 Beautiful Soup
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...

随机推荐

CSS实战2
1. 鼠标样式 Cursor: pointer 鼠标变成小手 Cursor: default; 小白 Cursor : move; 移动 Cursor : text ; 文本输入网 ...
Oracle 手工创建awr快照，获取报告
Oracle 的自动化工具都是通过后台的进程调用相关的函数实现,而Oracle也允许用户通过包来手工调用这些函数,显然这样增加了工具的安全性,也提高了可操作性,使得DBA可以更灵活的使用这些函数来满足 ...
使用actionerror做失败登录验证
一. 登录页面中放置如下代码: <h4>员工登录</h4> <div style="color:red"> <s:actionerror/ ...
牛客网NOIP赛前集训营-提高组18/9/9 A-中位数
链接:https://www.nowcoder.com/acm/contest/172/A来源:牛客网时间限制:C/C++ 1秒,其他语言2秒空间限制:C/C++ 262144K,其他语言5242 ...
SI - 硬件 - 服务器 - 知识科普
服务器对每个从事IT工作的人来说并不陌生,但是服务器所涉及的各种知识细节,并非大家都十分清楚,为了让大家深入了解服务器的关键知识点,笔者特意抽时间总结了这篇科普文章,旨在帮助读者全面了解服务器.今天内 ...
BootStrap的动态模态框及静态模态框
1.要用bootStrap这个框架就必须要重载它的class类,也就是说class要一样代码如下: 有疑问的可以在下面留言,欢迎大家一起交流 1.1动态模态框 <!DOCTYPE html&g ...
http状态码(status_codes)
首先:1XX 接受的请求正在处理,2XX请求正常处理完毕,3XX需要进行附加操作以完成请求(重定向?),4XX服务器无法处理请求(也就是客户端请求错误),5XX服务器处理请求出错. 当然不仅仅是一张图 ...
Python的virtualenv你用过吗?
1. 为什么要有virtualenv 在使用 Python 开发的过程中,工程一多,难免会碰到不同的工程依赖不同版本的库的问题: 亦或者是在开发过程中不想让物理环境里充斥各种各样的库,引发未来的依赖灾 ...
linux总结及常用命令
一.操作系统的作用: 1.是现代计算机系统中最基本和最重要的系统软件 2.承上启下的作用 3.向下对硬件操作进行封装 4.向上对用户和应用程序提供方便访问硬件的接口二.不同领域的操作系统: 1 ...
Python入门学习笔记4：他人的博客及他人的学习思路
看其他人的学习笔记,可以保证自己不走弯路.并且一举两得,即学知识又学方法! 廖雪峰:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958 ...

HDU 4782 Beautiful Soup （模拟+注意细节）

HDU 4782 Beautiful Soup （模拟+注意细节）的更多相关文章

随机推荐

热门专题