【Trie】模板（动态指针，静态数组）

Trie树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。

Trie 的强大之处就在于它的时间复杂度。它的插入和查询时间复杂度都为 O(k) ，其中 k 为 key 的长度，与 Trie 中保存了多少个元素无关。Hash 表号称是 O(1) 的，但在计算 hash 的时候就肯定会是 O(k) ，而且还有碰撞之类的问题；Trie 的缺点是空间消耗很高。

基本性质：
（1）根节点不包含字符，除根节点意外每个节点只包含一个字符。
（2）从根节点到某一个节点，路径上经过的字符连接起来，为该节点对应的字符串。
（3）每个节点的所有子节点包含的字符串不相同。

特性：
1）根节点不包含字符，除根节点外每一个节点都只包含一个字符。
2）从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
3）每个节点的所有子节点包含的字符都不相同。
4）如果字符的种数为n，则每个结点的出度为n，这也是空间换时间的体现，浪费了很多的空间。
5）插入查找的复杂度为O(n)，n为字符串长度。

基本思想（以字母树为例）：
1、插入过程

对于一个单词，从根开始，沿着单词的各个字母所对应的树中的节点分支向下走，直到单词遍历完，将最后的节点做标记，表示该单词已插入Trie树。
2、查询过程
从根开始按照单词的字母顺序向下遍历trie树，一旦发现某个节点标记不存在或者单词遍历完成而最后的节点未做标记，则表示该单词不存在，若最后的节点有标记，表示该单词存在。

复杂度：

　　建立Trie的复杂度为O(n*len)，而建立+查询在trie中是可以同时执行的，建立的过程也就可以成为查询的过程。所以总的复杂度为O(n*len)，实际查询的复杂度只是O(len)。

操作：

在Trie树中主要有3个操作，插入、查找和删除。一般情况下Trie树中很少存在删除单独某个结点的情况，因此只考虑删除整棵树。
1、插入

　　假设存在字符串str，Trie树的根结点为root。i=0，p=root。
　　1)取str[i]，判断p->next[str[i]-97]是否为空，若为空，则建立结点temp，并将p->next[str[i]-97]指向temp，然后p指向temp；
　　若不为空，则p=p->next[str[i]-97]；
　　2)i++，继续取str[i]，循环1)中的操作，直到遇到结束符'\0'，此时将当前结点p中的 exist置为true。

2、查找

　　假设要查找的字符串为str，Trie树的根结点为root，i=0，p=root
　　1)取str[i]，判断判断p->next[str[i]-97]是否为空，若为空，则返回false；若不为空，则p=p->next[str[i]-97]，继续取字符。
　　2)重复1)中的操作直到遇到结束符'\0'，若当前结点p不为空并且 exist 为true，则返回true，否则返回false。

3、删除

　　删除可以以递归的形式进行删除。

模板

（静态数组）

 #include<iostream>

 #include<cstdio>

 #include<cstdlib>

 #include<cstring>

 using namespace std;

 const int MAX_N = ;

 typedef struct TrieNode

 {

     bool is_leaf; //标记到字典树从根到当前结点所构成的字符串是否为一个(颜色)单词

     int id;          //当前字符串的编号

     struct TrieNode* next[];

 }TrieNode;

 TrieNode Node;

 TrieNode Root[MAX_N];

 int node_cnt;

 int idn;

 int Insert(char *word)

 {

     TrieNode *p = &Node;

     while(*word)

     {

         int ch = *word - 'a';

         if(p->next[ch] == NULL)

         {

             Root[node_cnt].is_leaf = false;

             Root[node_cnt].id = ;

             p->next[ch] = &Root[node_cnt++];

         }

         p = p->next[ch];

         word++;

     }

     if(p->is_leaf)

         return p->id;

     p->is_leaf = true;

     p->id = ++idn;

     return p->id;

 }

 bool Search(char *word)

 {

     TrieNode *p = &Node;

     while(*word && p)

     {

         p = p->next[*word-'a'];

         word++;

     }

     return(p != NULL && p->is_leaf);

 }

（动态指针）

 #include <iostream>

 #include <cstring>

 #include <cstdlib>

 #include <cstdio>

 using namespace std;

 const int branchNum = ; //声明常量

 int i;

 struct Trie_node

 {

    bool isStr; //记录此处是否构成一个串。

    Trie_node *next[branchNum];//指向各个子树的指针,下标0-25代表26字符

    Trie_node()

    {

        isStr = false;

        memset(next,NULL,sizeof(next));

    }

 };

 class Trie

 {

 public:

    Trie();

    void insert(const char* word);

    bool search(char* word);

    void deleteTrie(Trie_node *root);

 private:

    Trie_node* root;

 };

 Trie::Trie()

 {

    root = new Trie_node();

 }

 void Trie::insert(const char* word)

 {

    Trie_node *location = root;

    while(*word)

    {

        if(location->next[*word-'a'] == NULL)//不存在则建立

        {

            Trie_node *tmp = new Trie_node();

            location->next[*word-'a'] = tmp;

        }

        location = location->next[*word-'a']; //每插入一步，相当于有一个新串经过，指针要向下移动

        word++;

    }

    location->isStr = true; //到达尾部,标记一个串

 }

 bool Trie::search(char *word)

 {

    Trie_node *location = root;

    while(*word && location)

    {

        location = location->next[*word-'a'];

        word++;

    }

    return(location!=NULL && location->isStr);

 }

 void Trie::deleteTrie(Trie_node *root)

 {

    for(i = ; i < branchNum; i++)

    {

        if(root->next[i] != NULL)

        {

            deleteTrie(root->next[i]);

        }

    }

    delete root;

 }

 int main() //简单测试

 {

    Trie t;

    t.insert("a");

    t.insert("abandon");

    char* c = "abandoned";

    t.insert(c);

    t.insert("abashed");

    if(t.search("abashed"))

        printf("true\n");

 }

静态建树与动态建树的主要区别在于插入和删除操作。

插入操作：前者每次插入一个新节点当不存在相应字符时就利用实现已经创建好的数组存放，后者则动态申请一个节点。

删除操作：前者直接将根节点的next全部置为NULL即可，后者要释放所有动态申请的节点空间。

查询操作基本上一样。

然而动态分配内存和静态分配内存性能上存在显著不同！

静态分配会高效很多，但用了一些全局变量，不熟悉的情况下容易出错。熟悉了就没问题了。

动态分配，对于有多个测试实例，如果不释放动态分配的内存，可能导致MLE！

【Trie】模板（动态指针，静态数组）的更多相关文章

"《算法导论》之‘队列’"：队列的三种实现（静态数组、动态数组及指针）
本文有关栈的介绍部分参考自网站数据结构. 1. 队列 1.1 队列的定义队列(Queue)是只允许在一端进行插入,而在另一端进行删除的运算受限的线性表. (1)允许删除的一端称为队头(Front) ...
"《算法导论》之‘栈’"：栈的三种实现（静态数组、动态数组及指针）
本文有关栈的介绍部分参考自网站数据结构. 1. 栈 1.1 栈的定义栈(Stack)是限制仅在表的一端进行插入和删除运算的线性表. (1)通常称插入.删除的这一端为栈顶(Top),另一端称为栈底( ...
C++中关于[]静态数组和new分配的动态数组的区别分析
这篇文章主要介绍了C++中关于[]静态数组和new分配的动态数组的区别分析,很重要的概念,需要的朋友可以参考下本文以实例分析了C++语言中关于[]静态数组和new分配的动态数组的区别,可以帮助大家加 ...
C/C++静态数组与动态数组的区别
简介以下三行代码有什么区别? int a[10]; int *a = (int*)malloc(sizeof(int)*10); int *a = new int[10]; 第一行代码定义a为包含1 ...
delphi中String 和动态静态数组
默认string类型为ansiString:有编译开关控制 shortString: strShort : shortString; strShort 大小256字节,可根据sizeof()计算出,s ...
DelphiXe 中静态数组TByteArray和动态数组TBytes /array of byte 的区别
在应用中发现静态数组和动态数组是有区别的: procedure TForm1.Button1Click(Sender: TObject);var RsltStream: TMemoryStream; ...
Spring MVC 学习总结（七）——FreeMarker模板引擎与动态页面静态化
模板引擎可以让程序实现界面与数据分离,业务代码与逻辑代码的分离,这就提升了开发效率,良好的设计也使得代码复用变得更加容易.一般的模板引擎都包含一个模板解析器和一套标记语言,好的模板引擎有简洁的语法规则 ...
JS 索引数组、关联数组和静态数组、动态数组
JS 索引数组.关联数组和静态数组.动态数组数组分类: 1.从数组的下标分为索引数组.关联数组 var ary1 = [1,3,5,8]; //按索引去取数组元素,从0开始(当然某些语言实现从1开始 ...
c语言实现动态指针数组Dynamic arrays
c语言实现动态数组.其它c的数据结构实现,hashTable參考点击打开链接 treeStruct參考点击打开链接基本原理:事先准备好一个固定长度的数组. 假设长度不够的时候.realloc一块区域 ...

随机推荐

Web服务器与Web系统发布
在讨论Web系统发布之前,我们先来辨析两个概念:服务器.Web服务器. 通常,我们说的服务器,是一台提供服务的计算机,是硬件概念.这台主机有其IP地址,有服务端口,我们要访问时,就是通过IP地址唯一地 ...
js 浮点小数计算精度问题 parseFloat 精度问题
在js中进行以元为单位进行金额计算时使用parseFloat会产生精度问题 var price = 10.99; var quantity = 7; var needPay = parseFloat ...
NBearV3中文教程总目录
1.NBearV3 Step by Step教程——ORM篇摘要:本教程演示如何基于NBearV3的ORM模块开发一个Web应用程序的全过程.本教程演示的实体关系包括:继承.1对1关联.1对多关联, ...
【M29】引用计数
1.引用计数这项技术,是为了让等值对象对象共享同一实体.此技术的发展有两个动机:a.记录堆上分配的对象,是垃圾回收机制的简单原理:b.节省内存,多个对象具有相同的值,存储多次很笨.速度更快,等值对象避 ...
UVALive 4192 Close Enough Computations 水题
Close Enough Computations 题目连接: https://icpcarchive.ecs.baylor.edu/index.php?option=com_onlinejudge& ...
hdu 4497 GCD and LCM 数学
GCD and LCM Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=4 ...
linux C(hello world)
1.使用vi/vim进行编写代码并保存为hello_world.c.如下: /* This is my first C program*/ #include <stdio.h> int m ...
Android ListView标题置顶效果实现
一. 有图有真相二.实现: 1. 基于ListView分类效果 2. TitleView即标题的处理(创建) 3. 处理TitleView的三种状态三.源码: 例子下载实现可以看代码,具 ...
离线安装Android开发环境的方法
对于大家从官网上下载下来的SDK其实是一个安装工具,里面啥都没有,如果在线安装的话会需要很长时间.我们同样可以从网络上用下载工具将所需要安装的东西下载下来,(同样有劳大家自己动手找找了)然后直接放入相 ...
careercup-高等难度 18.7
18.7 给定一组单词,编写一个程序,找出其中的最长单词,且该单词由这组单词中的其他单词组合而成. 解法: 原题给定字符串,以及一个字典,判断字符串是否能够拆分为字段中的单词.例如,字段为{hell ...

【Trie】模板（动态指针，静态数组）

【Trie】模板（动态指针，静态数组）的更多相关文章

随机推荐

热门专题