BZOJ3172 单词 Fail树

题目大意：求一篇论文中每个单词分别在论文中出现多少次。

本题用AC自动机太慢，应该用Fail树将AC自动机中所有的Fail指针反向得到一个新树，这就是Fail树。对长度为x的字符串a和长度为y的字符串b，如果a是b的子串，则a可能与位于b[0,a],b[0,a+1],b[0,a+2]...b[0,y]中的后缀相等。根据fail指针的定义，只要沿着反向Fail边走，走到的节点所代表的字符串必然存在与a（前缀）相等的后缀。因此，一遍DFS，返回加上子节点的总Cnt值的当前节点的Cnt值，即可。注意，Trie树中，有些节点是多个字符串公用的，因此每次构造Trie树时，都要对每个节点的Cnt++，以等价于此处存在多个字符串。

#include <cstdio>

#include <cstring>

#include <cassert>

#include <algorithm>

#include <cmath>

#include <queue>

#include <vector>

using namespace std;

const int MAX_CHAR = , MAX_LEN = 1e6 + , MAX_STR = ;

struct FailTree

{

#define Root _nodes[0]

#define Org(x) x - 'a'

    struct Node;

    struct Edge;

    struct Node

    {

        Node *Next[MAX_CHAR], *Fail;

        int Cnt;

        Edge *Head;

        Node() :Cnt(), Fail(NULL), Head(NULL) { memset(Next, NULL, sizeof(Next)); }

    };

    vector<Node*> _nodes, Tail;

    struct Edge

    {

        Node *To;

        Edge *Next;

        Edge(Node *to, Edge *next):To(to),Next(next){}

    };

    vector<Edge*> _edges;

    FailTree()

    {

        _nodes.push_back(new Node());

    }

    void AddEdge(Node *from, Node *to)

    {

        Edge *e = new Edge(to, from->Head);

        from->Head = e;

        _edges.push_back(e);

    }

    Node *BuildTrie(char *s)

    {

        int len = strlen(s);

        Node *cur = Root;

        for (int i = ; i < len; i++)

        {

            if (!cur->Next[Org(s[i])])

                _nodes.push_back(cur->Next[Org(s[i])] = new Node());

            cur = cur->Next[Org(s[i])];

            cur->Cnt++;

        }

        return cur;

    }

    void Insert(char *s)

    {

        Tail.push_back(BuildTrie(s));

    }

    void SetFail()

    {

        static queue<Node*> q;

        q.push(Root);

        while (!q.empty())

        {

            Node *cur = q.front();

            q.pop();

            for (int i = ; i < MAX_CHAR; i++)

            {

                if (cur->Next[i])

                {

                    Node *temp = cur->Fail;

                    while (temp)

                    {

                        if (temp->Next[i])

                        {

                            cur->Next[i]->Fail = temp->Next[i];

                            AddEdge(temp->Next[i], cur->Next[i]);

                            break;

                        }

                        temp = temp->Fail;

                    }

                    if (!temp)

                    {

                        cur->Next[i]->Fail = Root;

                        AddEdge(Root, cur->Next[i]);

                    }

                    q.push(cur->Next[i]);

                }

            }

        }

    }

    int Dfs(Node *u)

    {

        for (Edge *e = u->Head; e; e = e->Next)

            u->Cnt += Dfs(e->To);

        return u->Cnt;

    }

}g;

int main()

{

#ifdef _DEBUG

    freopen("c:\\noi\\source\\input.txt", "r", stdin);

#endif

    int tot;

    char s[MAX_LEN];

    scanf("%d", &tot);

    for(int i=; i<tot; i++)

    {

        scanf("%s", s);

        g.Insert(s);

    }

    g.SetFail();

    g.Dfs(g.Root);

    for (int i = ; i < tot; i++)

        printf("%d\n", g.Tail[i]->Cnt);

    return ;

}

或者不用反向Fail指针也可以，站在后缀上去找其所包含的前缀。这样编程复杂度低一些。

#include <cstdio>

#include <cstring>

#include <vector>

#include <queue>

#include <cassert>

#include <cmath>

#include <algorithm>

using namespace std;

const int MAX_CHAR = , MAX_NODE = 5e5 + , MAX_LEN = 1e6 + ;

struct Node

{

    int Sum, Id, Cnt;

    Node *Fail;

    Node *Next[MAX_CHAR];

}Nodes[MAX_NODE];

int Nodes_Cnt = ;

char P[MAX_LEN];

Node *WordNode[MAX_NODE];

int Ord(char c)

{

    return c - 'a';

}

Node *NewNode()

{

    return ++Nodes_Cnt + Nodes;

}

Node *Root()

{

    return Nodes + ;

}

void BuildTrie(char *s, int id)

{

    Node *cur = Root();

    int len = strlen(s);

    for (int i = ; i < len; i++)

    {

        if (cur->Next[Ord(s[i])])

            cur = cur->Next[Ord(s[i])];

        else

            cur = cur->Next[Ord(s[i])] = NewNode();

    }

    cur->Sum++;

    cur->Id = id;

    WordNode[id] = cur;

}

void SetFail()

{

    queue<Node*> q;

    q.push(Root());

    while (!q.empty())

    {

        Node *cur = q.front();

        q.pop();

        for (int i = ; i < MAX_CHAR; i++)

        {

            if (cur->Next[i])

            {

                Node *temp = cur->Fail;

                while (temp)

                {

                    if (temp->Next[i])

                    {

                        cur->Next[i]->Fail = temp->Next[i];

                        break;

                    }

                    temp = temp->Fail;

                }

                if (!temp)

                {

                    cur->Next[i]->Fail = Root();

                }

                q.push(cur->Next[i]);

            }

        }

    }

}

int Dfs1(Node *cur)

{

    int cnt = cur->Sum;

    for (int i = ; i < MAX_CHAR; i++)

        if (cur->Next[i])

            cnt += Dfs1(cur->Next[i]);

    for (Node *temp = cur; temp != Root(); temp = temp->Fail)

        if (temp->Sum)

            temp->Cnt+=cnt;

    //cur->Cnt += cnt;

    return cnt;

}

int main()

{

    //freopen("c:\\noi\\source\\input.txt", "r", stdin);

    int totP;

    scanf("%d", &totP);

    for (int i = ; i < totP; i++)

    {

        scanf("%s", P);

        BuildTrie(P, i);

    }

    SetFail();

    Dfs1(Root());

    for (int i = ; i < totP; i++)

        printf("%d\n", WordNode[i]->Cnt);

    return ;

}

BZOJ3172 单词 Fail树的更多相关文章

【BZOJ2905】背单词 fail树+DFS序+线段树
[BZOJ2905]背单词 Description 给定一张包含N个单词的表,每个单词有个价值W.要求从中选出一个子序列使得其中的每个单词是后一个单词的子串,最大化子序列中W的和. Input 第一行 ...
bzoj 3172: [Tjoi2013]单词 fail树
题目大意: 一篇论文是由许多单词组成,现在想知道每个单词分别在论文中出现多少次. 题解: 我们首先考虑fail指针的含义如果fail[x] = y,那么我们就知道y作为x的后缀在x中出现了一次所以 ...
BZOJ3172[Tjoi2013]单词——AC自动机(fail树)
题目描述某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. 输入第一个一个整数N,表示有多少个单词,接下来N行每行一个单词.每个 ...
BZOJ3172 & 洛谷3966 [Tjoi2013]单词【fail树】
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MB Submit: 4293 Solved: 2083 [Submit][Stat ...
[Bzoj3172][Tjoi2013]单词（fail树）
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 4777 Solved: 2345[Submit][Status ...
BZOJ 3172: [Tjoi2013]单词 [AC自动机 Fail树]
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3198 Solved: 1532[Submit][Status ...
bzoj 3172 [Tjoi2013]单词（fail树，DP）
[题目链接] http://www.lydsy.com/JudgeOnline/problem.php?id=3172 [题意] 题目的意思是这样的,给若干个单词,求每个单词在这一堆单词中的出现次数. ...
BZOJ2905: 背单词 AC自动机+fail树+线段树
$zjq$神犇一眼看出$AC$自动机 $Orz$ 直接就讲做法了首先对每个串建出$AC$自动机将$fail$树找到然后求出$dfs$序我们发现一个单词 $S_i$是$S_j$的子串当且仅当$S ...
【洛谷】3966：[TJOI2013]单词【AC自动机】【fail树】
P3966 [TJOI2013]单词题目描述小张最近在忙毕设,所以一直在读论文.一篇论文是由许多单词组成但小张发现一个单词会在论文中出现很多次,他想知道每个单词分别在论文中出现了多少次. 输入输出 ...

随机推荐

python--6、logging模块
logging 可用的日志级别: debug 10 info 20 warning 30 error 40 critical 50 logging默认参数: 默认日志级别是warning. 默认情况日 ...
（转）Vue 爬坑之路（一）—— 使用 vue-cli 搭建项目
vue-cli 是一个官方发布 vue.js 项目脚手架,使用 vue-cli 可以快速创建 vue 项目,GitHub地址是:https://github.com/vuejs/vue-cli 一. ...
联想VIBE Shot（Z90-7/全网通）解锁BootLoader
工具下载链接: http://pan.baidu.com/s/1dF7zGTb 备用下载链接: http://pan.baidu.com/s/1i4UHP4L 本篇教程教你如何傻瓜式解锁BootLoa ...
poj1328 Radar Installation 区间贪心
题目大意: 在X轴选择尽量少的点作为圆心,作半径为d的圆.使得这些圆能覆盖所有的点. 思路: 把每个点都转化到X轴上.也就是可以覆盖这个点的圆心的位置的范围[a,b].然后按照每个点对应的a从小到大排 ...
Flutter GitLab 客户端
F4Lab Flutter for GitLab. 欢迎参加一起完成
Java_Web之宠物管理系统
使用JSP+servLet实现宠物管理系统,oraC1e11g作为后台数据厍,实现查看宠物和增加宠物的功能由你实现,如图: 其中宠物包栝:狗.猫.鸟.鼠具体要求及推荐实现步骤第一步:创建数据库代码 ...
Higher-Order Functions and Lambdas
https://kotlinlang.org/docs/reference/lambdas.html
模拟登录新浪微博（Python)
PC 登录新浪微博时, 在客户端用js预先对用户名.密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分. 这样, 就不能用通常的那种简单方法来模拟POST ...
爬虫写法进阶:普通函数--->函数类--->Scrapy框架
本文转载自以下网站: 从 Class 类到 Scrapy https://www.makcyun.top/web_scraping_withpython12.html 普通函数爬虫: https:// ...
python-pycharm windows安装
pycharm_IDE安装 1. 首先先pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/download/#section=windows,下载 ...

BZOJ3172 单词 Fail树

BZOJ3172 单词 Fail树的更多相关文章

随机推荐

热门专题