字符串——蒟蒻永远的阴影


对于字符串匹配

KMP很好的解决了以一个文本串匹配一个模板串的问题

但如果模板串有多个呢

这是KMP不再适用

我们引入一个新的数据结构——字典树

(当然又有像AC自动机这样更优的)

(但要理解AC自动机,便必须先学会KMP与字典树的思想)

字典树可以将多个单词压缩到一棵树上

这样便减少了对于一个文本串要匹配多个模板串时

要重复匹配相同前缀的弊端

先呈上一张字典树的图解

如图所示

字典树的每条边储存了一个字符

这样从根结点走下来

每个结点便代表一个单词

但特别的,根节点是不表示字符或单词的!!!

然而我们要怎样确定那些结点代表的单词在模板串里出现过呢

所以这里我们给那些代表的单词在模板串里出现过的结点

再插入时就打上一个标记

如图中黄色结点

这里也讲一下字典树的缺点

由于树的每层都要对应有26个字母

那么如果模板串很长

空间开销就会特别大

如果不止小写字母

那么空间开销还会更大

不过一般的题目也不会卡那么紧

下面是字典树的基本操作


字典树结构体

struct node
{
    node* nxt[26];//对应下一层字母的指针
    bool judge;//判断该单词模板串里出现过
    node()//构造函数;初始化
    {
        judge=false;
        for(int i=0;i<26;i++)
        nxt[i]=NULL;
    }
};
node* rt=new node();//初始根结点

插入

void ins(char ss[])
{
    int len=strlen(ss);
    node* p=rt;
    for(int i=0;i<len;i++)
    {
        int num=ss[i]-'a';//找到下一层结点
        if(p->nxt[num]==NULL)
        {
            node* k=new node();
            p->nxt[num]=k;
        }//如果该节点不存在则创建新结点,否则继续迭代插入
        p=p->nxt[num];
    }
    p->judge=true;//单词插入完毕,标记该节点
}

查找/匹配

bool find(char ss[])
{
    int len=strlen(ss);
    node* p=rt;
    for(int i=0;i<len;i++)
    {
        int num=ss[i]-'a';
        p=p->nxt[num];
        if(p==NULL) return false;
        //如查找过程中有结点不存在,则匹配失败
    }
    if(p->judge)return true;
    //遍历完文本串,若该接点被标记,则查着成功
    else return false;//否则查找失败
}

其实插入和查找的代码挺像的不是嘛

Trie树 字典树-学习笔记的更多相关文章

  1. 剑指Offer——Trie树(字典树)

    剑指Offer--Trie树(字典树) Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种的单词.对于每一个单词,我们要判断他出没出现过,如果出现了,求第一次出现在第几个位 ...

  2. AC自动机——1 Trie树(字典树)介绍

    AC自动机——1 Trie树(字典树)介绍 2013年10月15日 23:56:45 阅读数:2375 之前,我们介绍了Kmp算法,其实,他就是一种单模式匹配.当要检查一篇文章中是否有某些敏感词,这其 ...

  3. 珂朵莉树(Chtholly Tree)学习笔记

    珂朵莉树(Chtholly Tree)学习笔记 珂朵莉树原理 其原理在于运用一颗树(set,treap,splay......)其中要求所有元素有序,并且支持基本的操作(删除,添加,查找......) ...

  4. Trie(字典树)

    没时间整理了,老吕又讲课了@ @ 概念 Trie即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种,典型应用是统计和排序大量的字符串(不限于字符串) Trie字典树主要用于存储字符串, ...

  5. 9-11-Trie树/字典树/前缀树-查找-第9章-《数据结构》课本源码-严蔚敏吴伟民版

    课本源码部分 第9章  查找 - Trie树/字典树/前缀树(键树) ——<数据结构>-严蔚敏.吴伟民版        源码使用说明  链接☛☛☛ <数据结构-C语言版>(严蔚 ...

  6. Trie树(字典树)的介绍及Java实现

    简介 Trie树,又称为前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串.与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定.一个节点的所有子孙都有相同的前缀,也 ...

  7. Trie(前缀树/字典树)及其应用

    Trie,又经常叫前缀树,字典树等等.它有很多变种,如后缀树,Radix Tree/Trie,PATRICIA tree,以及bitwise版本的crit-bit tree.当然很多名字的意义其实有交 ...

  8. [LintCode] Implement Trie 实现字典树

    Implement a trie with insert, search, and startsWith methods. Have you met this question in a real i ...

  9. Trie树|字典树(字符串排序)

    有时,我们会碰到对字符串的排序,若采用一些经典的排序算法,则时间复杂度一般为O(n*lgn),但若采用Trie树,则时间复杂度仅为O(n). Trie树又名字典树,从字面意思即可理解,这种树的结构像英 ...

随机推荐

  1. android 基础02 - Activity 的生命周期及状态

    返回栈 Android 中的 Activity 是可以层叠的,当我们启动一个新的 Activity 时,就会覆盖在原有的 Activity 之上, 点击 Back 会销毁当前 Activity,下面的 ...

  2. Java 中判断类和实例之间的关系

    判断类与实例的关系有以下三种方式 1.instanceof关键字,用来判断对象是否是类的实例 (对象 => 类 )   2.isAssignableFrom,用来判断类型间是否存在派生关系 (类 ...

  3. Mysql 范围查询优化

    Range查询:用单独的Index的一个或多个index值来检索表的子集行数据,当然包含多个index. 1:一个index (单一部分)的range access 方法:(eg : 指的这种key ...

  4. List源码学习之ArrayList

    ArrayList 内部结构为一个可重复的对象数组(可存空对象). 内部有以下几个参数: ;/** * 用于空实例的共享空数组实例 */private static final Object[] EM ...

  5. 【Java框架型项目从入门到装逼】第十二节 项目分层

    这一节我们开始对项目进行分层,一般来说,一个web项目的层次结构如下图所示: controller层为我们的控制层,用来接收用户的请求,比如新增一个学生的信息,新增的请求最先就是走到这一层.contr ...

  6. scrapy-redis功能简介

    connection:连接redis最基本文件 default:默认值设置文件 dupefiler_key 保存指纹 dupefilter:替换scrapy默认的url去重器 piklecompat: ...

  7. linux根据端口号查询来源程序

    1.根据端口号查询进程  netstat -tunlp|grep port 2.根据进程查询来源程序 ps aux | grep pid 上图看出所属进程为2281 上图看出占用8083端口的程序为n ...

  8. Tomcat对Struts中的Action进行授权利

    .应用的意义 在某些应用下,如果Action类执行的功能比较重要,可以对该Action类进行授权利以实现只有特定角色的用户能够访问,此时可以在struts-config.xml文件中进行配置   2. ...

  9. func_get_args  获取一个函数的所有参数

    func_get_args  获取一个函数的所有参数 {     $numargs = func_num_args(); //参数数量     echo "参数个数是: $numargs&l ...

  10. ubuntu网桥设置

    什么是桥接? 桥接(Bridging),是指依据OSI网络模型的链路层的地址,对网络数据包进行转发的过程,工作在OSI的第二层.一般的交换机,网桥就有桥接作用. 一般的交换机,网桥就有桥接作用.就交换 ...