字符串——蒟蒻永远的阴影


对于字符串匹配

KMP很好的解决了以一个文本串匹配一个模板串的问题

但如果模板串有多个呢

这是KMP不再适用

我们引入一个新的数据结构——字典树

(当然又有像AC自动机这样更优的)

(但要理解AC自动机,便必须先学会KMP与字典树的思想)

字典树可以将多个单词压缩到一棵树上

这样便减少了对于一个文本串要匹配多个模板串时

要重复匹配相同前缀的弊端

先呈上一张字典树的图解

如图所示

字典树的每条边储存了一个字符

这样从根结点走下来

每个结点便代表一个单词

但特别的,根节点是不表示字符或单词的!!!

然而我们要怎样确定那些结点代表的单词在模板串里出现过呢

所以这里我们给那些代表的单词在模板串里出现过的结点

再插入时就打上一个标记

如图中黄色结点

这里也讲一下字典树的缺点

由于树的每层都要对应有26个字母

那么如果模板串很长

空间开销就会特别大

如果不止小写字母

那么空间开销还会更大

不过一般的题目也不会卡那么紧

下面是字典树的基本操作


字典树结构体

struct node
{
    node* nxt[26];//对应下一层字母的指针
    bool judge;//判断该单词模板串里出现过
    node()//构造函数;初始化
    {
        judge=false;
        for(int i=0;i<26;i++)
        nxt[i]=NULL;
    }
};
node* rt=new node();//初始根结点

插入

void ins(char ss[])
{
    int len=strlen(ss);
    node* p=rt;
    for(int i=0;i<len;i++)
    {
        int num=ss[i]-'a';//找到下一层结点
        if(p->nxt[num]==NULL)
        {
            node* k=new node();
            p->nxt[num]=k;
        }//如果该节点不存在则创建新结点,否则继续迭代插入
        p=p->nxt[num];
    }
    p->judge=true;//单词插入完毕,标记该节点
}

查找/匹配

bool find(char ss[])
{
    int len=strlen(ss);
    node* p=rt;
    for(int i=0;i<len;i++)
    {
        int num=ss[i]-'a';
        p=p->nxt[num];
        if(p==NULL) return false;
        //如查找过程中有结点不存在,则匹配失败
    }
    if(p->judge)return true;
    //遍历完文本串,若该接点被标记,则查着成功
    else return false;//否则查找失败
}

其实插入和查找的代码挺像的不是嘛

Trie树 字典树-学习笔记的更多相关文章

  1. 剑指Offer——Trie树(字典树)

    剑指Offer--Trie树(字典树) Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种的单词.对于每一个单词,我们要判断他出没出现过,如果出现了,求第一次出现在第几个位 ...

  2. AC自动机——1 Trie树(字典树)介绍

    AC自动机——1 Trie树(字典树)介绍 2013年10月15日 23:56:45 阅读数:2375 之前,我们介绍了Kmp算法,其实,他就是一种单模式匹配.当要检查一篇文章中是否有某些敏感词,这其 ...

  3. 珂朵莉树(Chtholly Tree)学习笔记

    珂朵莉树(Chtholly Tree)学习笔记 珂朵莉树原理 其原理在于运用一颗树(set,treap,splay......)其中要求所有元素有序,并且支持基本的操作(删除,添加,查找......) ...

  4. Trie(字典树)

    没时间整理了,老吕又讲课了@ @ 概念 Trie即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种,典型应用是统计和排序大量的字符串(不限于字符串) Trie字典树主要用于存储字符串, ...

  5. 9-11-Trie树/字典树/前缀树-查找-第9章-《数据结构》课本源码-严蔚敏吴伟民版

    课本源码部分 第9章  查找 - Trie树/字典树/前缀树(键树) ——<数据结构>-严蔚敏.吴伟民版        源码使用说明  链接☛☛☛ <数据结构-C语言版>(严蔚 ...

  6. Trie树(字典树)的介绍及Java实现

    简介 Trie树,又称为前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串.与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定.一个节点的所有子孙都有相同的前缀,也 ...

  7. Trie(前缀树/字典树)及其应用

    Trie,又经常叫前缀树,字典树等等.它有很多变种,如后缀树,Radix Tree/Trie,PATRICIA tree,以及bitwise版本的crit-bit tree.当然很多名字的意义其实有交 ...

  8. [LintCode] Implement Trie 实现字典树

    Implement a trie with insert, search, and startsWith methods. Have you met this question in a real i ...

  9. Trie树|字典树(字符串排序)

    有时,我们会碰到对字符串的排序,若采用一些经典的排序算法,则时间复杂度一般为O(n*lgn),但若采用Trie树,则时间复杂度仅为O(n). Trie树又名字典树,从字面意思即可理解,这种树的结构像英 ...

随机推荐

  1. Uva 1599 Ideal Path - 双向BFS

    题目连接和描述以后再补 这题思路很简单但还真没少折腾,前后修改提交了七八次才AC...(也说明自己有多菜了).. 注意问题: 1.看清楚原题的输入输出要求,刚了书上的中文题目直接开撸,以为输入输出都是 ...

  2. DESTOON B2B标签(tag)调用手册

    路径:include/tag.func.php 1.标签格式的大致说明 {tag("moduleid=9&table=article_9&length=40&cond ...

  3. 将js进行到底:node学习笔记2

    node重要API之FS--CLI编程初体验 所谓的"fs"就是file system! 当下几乎任何一门编程语言都会提供对文件系统读写的API,比如c语言的open()函数. 而 ...

  4. CCF系列之数列分段(201509-1)

    试题名称: 数列分段 试题编号: 201509-1 时间限制: 1.0s 内存限制: 256.0MB 问题描述 给定一个整数数列,数列中连续相同的最长整数序列算成一段,问数列中共有多少段? 输入格式 ...

  5. mybatis if条件查询 及<号的问题

    摘录自:http://flt95.blog.163.com/blog/static/12736128920136185841551/ <if test="p=='1'"> ...

  6. 底部粘连(stiky footer)布局

    前面的话 在网页设计中,Sticky footers设计是最古老和最常见的效果之一,大多数人都曾经经历过.它可以概括如下:如果页面内容不够长的时候,页脚块粘贴在视窗底部:如果内容足够长时,页脚块会被内 ...

  7. RocketMQ-顺序消费

    看了https://www.jianshu.com/p/453c6e7ff81c这篇博客,得出顺序消费的结论."要实现严格的顺序消息,简单且可行的办法就是:保证生产者 - MQServer ...

  8. js_4_函数

    js的函数是怎么定义的? function 函数名(形参1,......) { 函数体: return 返回值 :                                 //  可以没有返回 ...

  9. 1_mysql_认识

    什么是数据库? -- 数据                 -- 处理+存储 信息 -- 数据库              -- 存取数据 软件 本质是对文件系统的上层封装,通过软件去管理文件,管理数 ...

  10. java.lang.IllegalArgumentException: Document base D:\Project\workspace\space\.metadata\.plugins\org.eclipse.wst.server.core\tmp7\wtpwebapps\Blog

    java.lang.IllegalArgumentException: Document base D:\Project\workspace\space\.metadata\.plugins\org. ...