GeekforGeeks Trie - 键树简单介绍

https://blog.csdn.net/kenden23/article/details/24453639

Trie是非常高效的信息检索数据结构，时间效率会是O(m)，当中m是须要搜索的keyword的长度。

缺点就是须要的存储空间大。

Trie的特点：

1. 每一个Trie的节点都由多个分支构成

2. 每一个分支代表可能的keyword的一个字符

3. 须要mark（标志）每一个keyword的最后一个字符为leaf node（叶子节点）

英文字母的节点数据结构能够表演示样例如以下：

struct TrieNode

{

	int value; /* Used to mark leaf nodes */

	TrieNode *children[ALPHABET_SIZE];

};

插入keyword：

1. keyword的每一个字符都作为独立的trie节点，注意每一个子节点都是一组指针，指向下一个trie节点。

2 假设输入的keyword是新的，或者是比原有keyword长，就须要构造新的节点，并且须要标志它的结束点为叶子节点。

3. 假设keyword比原有的某个keyword短，那么就能够仅仅标志新的叶子节点。

4. keyword的长度决定了trie的深度

搜索keyword：

1. 比較keyword的字符。然后往下一层移动

2. 假设keyword结束，或者没有这个字符在trie中，那么搜索结束。前者比較最后一个节点是否是叶子节点，假设是表示搜索成功，否则不成功。后者表示搜索不成功。

參考原文：

http://www.geeksforgeeks.org/trie-insert-and-search/

实现程序：

#include <stdio.h>

#include <stdlib.h>

#include <iostream>

#include <string>

#define ARRAY_SIZE(a) sizeof(a)/sizeof(a[0])

#define ALPHABET_SIZE (26)

#define CHAR_TO_INDEX(c) ((int)c - (int)'a')

struct TrieNode

{

	int value; /* Used to mark leaf nodes */

	TrieNode *children[ALPHABET_SIZE];

};

struct TrieT

{

	TrieNode *root;

	int count;

};

// Returns new trie node (initialized to NULLs)

TrieNode *getNode(void)

{

	TrieNode *pNode = NULL;

	pNode = (TrieNode *)malloc(sizeof(TrieNode));

	if( pNode )

	{

		int i;

		pNode->value = 0;

		for(i = 0; i < ALPHABET_SIZE; i++)

		{

			pNode->children[i] = NULL;

		}

	}

	return pNode;

}

// Initializes trie (root is dummy node)

void initialize(TrieT *pTrie)

{

	pTrie->root = getNode();

	pTrie->count = 0;

}

// If not present, inserts key into trie

// If the key is prefix of trie node, just marks leaf node

void insert(TrieT *pTrie, char key[])

{

	int level = 0;

	int length = strlen(key);

	int index = 0;

	TrieNode *pCrawl;

	pTrie->count++;

	pCrawl = pTrie->root;

	for( level = 0; level < length; level++ )

	{

		index = CHAR_TO_INDEX(key[level]);

		if( !pCrawl->children[index] )

		{

			pCrawl->children[index] = getNode();

		}

		pCrawl = pCrawl->children[index];

	}

	// mark last node as leaf

	pCrawl->value = pTrie->count;

}

// Returns non zero, if key presents in trie

int search(TrieT *pTrie, char key[])

{

	int level;

	int length = strlen(key);

	int index;

	TrieNode *pCrawl;

	pCrawl = pTrie->root;

	for( level = 0; level < length; level++ )

	{

		index = CHAR_TO_INDEX(key[level]);

		if( !pCrawl->children[index] )

		{

			return 0;

		}

		pCrawl = pCrawl->children[index];

	}

	return (0 != pCrawl && pCrawl->value);

}

// Driver

int main()

{

	// Input keys (use only 'a' through 'z' and lower case)

	char keys[][8] = {"the", "a", "there", "answer", "any", "by", "bye", "their"};

	TrieT trie;

	char output[][32] = {"Not present in trie", "Present in trie"};

	initialize(&trie);

	// Construct trie

	for(int i = 0; i < ARRAY_SIZE(keys); i++)

	{

		insert(&trie, keys[i]);

	}

	// Search for different keys

	printf("%s --- %s\n", "the", output[search(&trie, "the")] );

	printf("%s --- %s\n", "these", output[search(&trie, "these")] );

	printf("%s --- %s\n", "their", output[search(&trie, "their")] );

	printf("%s --- %s\n", "thaw", output[search(&trie, "thaw")] );

	return 0;

}

更新 2014 5 -16

C++写的类，主要是带构造函数和析构函数。能够非常好管理内存，甚至不须要递归地手动释放内存了，析构函数能够自己主动递归调用释放全部Node，这个是C++比C强大的地方之中的一个：

class TrieInsertAndSearch

{

	const static int ALPH_SIZE = 26;

	struct Node

	{

		int val;

		Node *children[ALPH_SIZE];

		explicit Node(int v = 0) : val(v)

		{

			for (int i = 0; i < ALPH_SIZE; i++)

			{

				children[i] = nullptr;

			}

		}

		~Node()

		{

			for (int i = 0; i < ALPH_SIZE; i++)

			{

				if (children[i]) delete children[i];

				children[i] = nullptr;

			}

		}

	};

	struct Tree

	{

		Node *root;

		int count;

		explicit Tree(int c = 0, Node *r = nullptr) : count(c), root(r){}

		~Tree()

		{

			if (root) delete root;

			root = nullptr;

		}

	};

	Tree *pT;

	void insert(char key[])

	{

		int len = strlen(key);

		Node *pCrawl = pT->root;

		pT->count++;

		for (int lv = 0; lv < len; lv++)

		{

			int id = key[lv] - 'a';

			if (!pCrawl->children[id])

			{

				pCrawl->children[id] = new Node;

			}

			pCrawl = pCrawl->children[id];

		}

		pCrawl->val = pT->count;

	}

	bool search(char key[])

	{

		int len = strlen(key);

		Node *pCrawl = pT->root;

		for (int lv = 0; lv < len; lv++)

		{

			int id = key[lv] - 'a';

			if (!pCrawl->children[id]) return false;

			pCrawl = pCrawl->children[id];

		}

		return (pCrawl && pCrawl->val);

	}

public:

	TrieInsertAndSearch()

	{

		char keys[][8] = {"the", "a", "there", "answer", "any", "by", "bye", "their"};

		pT = new Tree(0, new Node);

		int n = sizeof(keys) / sizeof(keys[0]);

		for (int i = 0; i < n; i++)

		{

			insert(keys[i]);

		}

		// Search for different keys

		if (search("the")) printf("the is in Trie\n");

		else printf("the is not in Trie\n");

		if (search("these")) printf("these is in Trie\n");

		else printf("these is not in Trie\n");

		if (search("their")) printf("their is in Trie\n");

		else printf("their is not in Trie\n");

		if (search("thaw")) printf("thaw is in Trie\n");

		else printf("thaw is not in Trie\n");

	}

	~TrieInsertAndSearch()

	{

		if (pT) delete pT;

		pT = nullptr;

	}

};

GeekforGeeks Trie - 键树简单介绍 - 构造插入和搜索的更多相关文章

UE4中的AI行为树简单介绍
UE4引擎中可以实现简单AI的方式有很多,行为树是其中比较常用也很实用的AI控制方式,在官网的学习文档中也有最简单的目标跟踪AI操作教程,笔者在这里只作简单介绍. AIController->和 ...
Trie树的创建、插入、查询的实现
原文:http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=28977986&id=3807947 1.什么是Trie树 Tr ...
萌新笔记——C++里创建 Trie字典树（中文词典）（一）（插入、遍历）
萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...
C++里创建 Trie字典树（中文词典）（一）（插入、遍历）
萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...
SQL 数据库学习 007 通过一个示例简单介绍什么是字段、属性、列、元组、记录、表、主键、外键（上）
SQL 数据库学习 007 通过一个示例简单介绍什么是字段.属性.列.元组.记录.表.主键.外键 (上) 我们来介绍一下:数据库是如何存储数据的. 数据库是如何存储数据的来看一个小例子 scott ...
BST&AVL&红黑树简单介绍
(BST&AVL&红黑树简单介绍) 前言: 节主要是给出BST,AVL和红黑树的C++代码,方便自己以后的查阅,其代码依旧是data structures and algorithm ...
算法设计和数据结构学习_5(BST&AVL&红黑树简单介绍)
前言: 节主要是给出BST,AVL和红黑树的C++代码,方便自己以后的查阅,其代码依旧是data structures and algorithm analysis in c++ (second ed ...
python利用Trie(前缀树)实现搜索引擎中关键字输入提示（学习Hash Trie和Double-array Trie）
python利用Trie(前缀树)实现搜索引擎中关键字输入提示(学习Hash Trie和Double-array Trie) 主要包括两部分内容:(1)利用python中的dict实现Trie:(2) ...
《PHP 5.5从零開始学（视频教学版）》内容简单介绍、文件夹
<PHP 5.5从零開始学(视频教学版)>当当网购买地址: http://product.dangdang.com/23586810.html <PHP 5.5从零開始学(视频教学版 ...

随机推荐

Win7如何安装IIS来浏览ASP网站
1 进入控制面板-->程序与功能-->点击左侧的"打开或关闭Windows功能"-->把"Internet信息服务"给勾上,点击"确 ...
python sqlite3 MySQLdb
SQLite是一种嵌入式数据库,它的数据库就是一个文件.由于SQLite本身是C写的,而且体积很小,所以,经常被集成到各种应用程序中,甚至在iOS和Android的App中都可以集成. Python就 ...
Ubuntu升级出现/boot空间不足解决（转）
经常升级Linux内核,导致更新时警告/boot分区空间不足.这是以为多次升级内核后,导致内核版本太多,清理一下没用的内核文件就行了.命令如下: zht@zht-Ubuntu:~$ dpkg -l ' ...
Android笔记---使用HttpClient发送POST和GET请求
在Android上发送 HTTP 请求的方式一般有两种, HttpURLConnection 和 HttpClient,关于HttpURLConnection的使用方法能够參考HTTP之利用HttpU ...
TELNET模拟HTTP请求
开启nginx服务,查看服务器地址(192.168.11.119) 使用telnet命令连接服务器的80端口 http协议报文格式 1.request 2.response 输入请求行: GET / ...
如何检测一个aspx页面的速度慢的原因
最近读到一篇文章,是关于如何提高一个aspx页面的速度.这是一个常见的面试问题.该问题原文出自这个网站. 出现这个问题的原因会多种多样,我们需要一步一步的排查来定位问题真正出现在哪里. 1. 找出那一 ...
@Autowired @Transaction @Service同时出现。
对于@Autowired,如果只写这些,肯定是根据类型自动装配这个没问题. @Service public class AcRoleServiceImpl implements AcRoleServi ...
浅谈JavaScript变量声明提升
前段时间阿里实习生内推,一面就被刷了,也是郁闷.今天系统给发通知,大致意思就是内推环节不足以了解彼此,还可以参加笔试,于是赶紧再投一次.官网流程显示笔试时间3月31日,时间快到了,开始刷题.网上搜了一 ...
windows 下编译64位ffmpeg
window下如何编译ffmpeg 前文已有介绍,前面介绍的都是如何编译32位的库,本文主要介绍window 下如何编译64位ffmpeg库. 一.搭建编译环境 1.下载 windows下编译64位F ...
Oracle database datafile header中记录的datafile的大小
本文的环境:Oracle Databae 12.1.0.2, rhel5.9 x86-64bit [oracle@rhel59 orcl]$ pwd /u01/app/oracle/oradata/o ...

GeekforGeeks Trie - 键树简单介绍 - 构造 插入 和 搜索

GeekforGeeks Trie - 键树简单介绍 - 构造 插入 和 搜索的更多相关文章

随机推荐

热门专题

GeekforGeeks Trie - 键树简单介绍 - 构造插入和搜索

GeekforGeeks Trie - 键树简单介绍 - 构造插入和搜索的更多相关文章