Trie树的分析与实现

字典树

又称单词查找树，Trie树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。（From baike）

它有三个基本性质：

(1)根节点不存储字符
(2)除根节点外每一个节点都只存储一个字符
(3)从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串，每个节点的所有子节点包含的字符都不相同。

Java实现代码(注释详细):

 package com.wxisme.trietree;

 /**

  *Trie树的实现

  *@author wxisme

  *@time 2015-10-13 下午9:48:30

  */

 public class TrieTree {

     private final int SIZE = 26;//字符出现的种类数,以所有的小写字母为例

     private int nodeNumber;//子节点的个数

     private int depth;//树的深度

     private TrieNode root;//树根

     public TrieTree() {

         this.nodeNumber = 0;

         this.depth = 0;

         this.root = new TrieNode();

     }

     /**

      * 节点结构

      * @author wxisme

      *

      */

     private class TrieNode {

         private char val;//节点值

         private TrieNode son[];//子节点数组

         private boolean isEnd;//是否有以此节点为结束字符的单词

         private int pearNumber;//节点出现的次数

         public TrieNode() {

             this.isEnd = false;

             this.pearNumber = 0;

             this.son = new TrieNode[SIZE];

         }

     }

     /**

      * 向Trie中插入一个word

      * @param word

      */

     public void insert(String word) {

         char[] wordChars = word.toCharArray();

         TrieNode node = this.root;

         for(char ch : wordChars) {

             int pos = ch - 'a';

             //如果相应位置为空则创建

             if(node.son[pos] == null) {

                 node.son[pos] = new TrieNode();

                 node.son[pos].val = ch;

                 node.pearNumber = 1;//第一次出现

                 this.nodeNumber ++;

             }

             else {//已经有该字符

                 node.pearNumber ++;

             }

             node = node.son[pos];

         }

         node.isEnd = true;

         this.depth = Math.max(this.depth, word.length());

     }

     /**

      * 查找是否存在单词word

      * @param word

      * @return 结果

      */

     public boolean search(String word) {

         char[] wordChars = word.toCharArray();

         TrieNode node = this.root;

         for(char ch : wordChars) {

             int pos = ch - 'a';

             if(node.son[pos] != null) {

                 node = node.son[pos];//继续向下查找

             }

             else {

                 return false;

             }

         }

         return node.isEnd;

     }

     /**

      * 查找是否存在以word为前缀的单词，和search()类似，只是不用判断边界。

      * @param word

      * @return 结果

      */

     public boolean searchPrefix(String word) {

         char[] wordChars = word.toCharArray();

         TrieNode node = this.root;

         for(char ch : wordChars) {

             int pos = ch - 'a';

             if(node.son[pos] != null) {

                 node = node.son[pos];//继续向下查找

             }

             else {

                 return false;

             }

         }

         return true;

     }

     /**

      * 统计单词出现的次数

      * @param word

      * @return 结果

      */

     public int wordCount(String word) {

         char[] wordChars = word.toCharArray();

         TrieNode node = this.root;

         for(char ch : wordChars) {

             int pos = ch - 'a';

             if(node.son[pos] == null) {

                 return 0;

             }

             else {

                 node = node.son[pos];

             }

         }

         return node.isEnd?node.pearNumber:0;

     }

     /**

      * 统计以word为前缀的单词个数

      * @param word

      * @return 结果

      */

     public int wordPrefixCount(String word) {

         char[] wordChars = word.toCharArray();

         TrieNode node = this.root;

         for(char ch : wordChars) {

             int pos = ch - 'a';

             if(node.son[pos] == null) {

                 return 0;

             }

             else {

                 node = node.son[pos];

             }

         }

         return node.pearNumber;

     }

     /**

      * 深度优先遍历Trie树

      * @param root

      */

     public void traversal(TrieNode root) {

         if(root == null) {

             return;

         }

         for(TrieNode node : root.son) {

             System.out.println(node.val);

             traversal(node);

         }

     }

     public int getNodeNumber() {

         return nodeNumber;

     }

     public int getDepth() {

         return depth;

     }

     public TrieNode getRoot() {

         return root;

     }

 }

Leetcode应用：http://www.cnblogs.com/wxisme/p/4875309.html http://www.cnblogs.com/wxisme/p/4876980.html

Trie树的分析与实现的更多相关文章

Trie树（c++实现）
转:http://www.cnblogs.com/kaituorensheng/p/3602155.html http://blog.csdn.net/insistgogo/article/detai ...
【BZOJ-4523】路由表 Trie树 + 乱搞
4523: [Cqoi2016]路由表 Time Limit: 30 Sec Memory Limit: 512 MBSubmit: 155 Solved: 98[Submit][Status][ ...
【Hihocoder】1014 : Trie树
问题:http://hihocoder.com/problemset/problem/1014 给定一个字符串字典dict,输入字符串str, 要求从dict中找出所有以str为前缀的字符串个数. 构 ...
Trie树
一.什么是trie树 1.Trie树 (特例结构树) Trie树,又称单词查找树.字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树结构.典型应用是用于统计和排序大量的字符串( ...
数据结构《16》----自动补齐实现《一》----Trie 树
1. 简述 Trie 树是一种高效的字符串查找的数据结构.可用于搜索引擎中词频统计,自动补齐等. 在一个Trie 树中插入.查找某个单词的时间复杂度是 O(len), len是单词的长度. 如果采用平 ...
字符串 --- KMP Eentend-Kmp 自动机 trie图 trie树后缀树后缀数组
涉及到字符串的问题,无外乎这样一些算法和数据结构:自动机 KMP算法 Extend-KMP 后缀树后缀数组 trie树 trie图及其应用.当然这些都是比较高级的数据结构和算法,而这里面最常用和最熟 ...
[POJ] #1002# 487-3279 : 桶排序/字典树(Trie树)/快速排序
一. 题目 487-3279 Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 274040 Accepted: 48891 ...
trie树（前缀树）
问题描述: Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优 ...
[转]数据结构之Trie树
1. 概述 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. Trie一词来自retrieve,发音为/tr ...

随机推荐

VMware安装与VMware下安装CentOS系统
1.下载安装VMware,我安装的是VMware 12.VMware从11开始不再支持32位系统,32位系统请安装VMware10. VMware官方功能特性介绍http://www.vmware.c ...
VS 调试无法启动IIS Express Web 服务器（进程不存在）
拷贝VS2015项目出现无法启动IIS Express Web 服务器一.把你们拷贝刀本机的解决方案文件中的隐藏文件夹.vs删除掉重新生产解决方案就可以启动iis express了.
java线程安全问题之静态变量、实例变量、局部变量
java多线程编程中,存在很多线程安全问题,至于什么是线程安全呢,给出一个通俗易懂的概念还是蛮难的,如同<java并发编程实践>中所说: 写道给线程安全下定义比较困难.存在很多种定义,如 ...
.net framework 4.0 在 VS2010 安装目录下位置 dotNetFx40_Full_x86_x64.exe在磁盘哪个目录？
.net framework 4.0 在 VS2010 安装目录下位置 dotNetFx40_Full_x86_x64.exe在磁盘哪个目录? 使用VS2010开发应用程序完毕后,在发布应用程序时,常 ...
PHP数据库备份与恢复
先说下关于数据库备份与恢复的原理: 1.查找所有表->2.查找所有字段->3.查找所有数据->4.生成SQL 备份注意点: 2=>需要列出所有字段名,字段类型等相关信息 3=& ...
Spring Boot 处理 REST API 错误的正确姿势
摘要:如何正确的处理API的返回信息,让返回的错误信息提供更多的含义是一个非常值得做的功能.默认一般返回的都是难以理解的堆栈信息,然而这些信息也许对于API的客户端来说有可能并没有多大用途,并没有多大 ...
in语句导致查询很慢
1.表A,表B,表C.其中A中的主键是B的外键,一对多的关系:B的主键是C的外键,一对多的关系.最终想查出所有符合条件的C. 原因:开发人员将A表数据先查出来,放到list中,然后用list作为in的 ...
史上最强大的python selenium webdriver的包装
1.之前已经发过两次使用单浏览器了,但是这个最完美,此篇并没有使用任何单例模式的设计模式,用了实例属性结果缓存到类属性. 2.最简单的控制单浏览器是只实例化一次类,然后一直使用这个对象,但每个地方运行 ...
IOS 应用官方接口地址
地址: http://www.apple.com/itunes/affiliates/resources/documentation/itunes-store-web-service-search-a ...
my-small.ini、my-medium.ini、my-large.ini、my-huge.ini文件的作用
安装完mysql之后或者是下载的免安装版解压之后,默认是没有my.ini文件的.但是,有几个类似的文件,如my-small.ini.my-medium.ini.my-large.ini.my-huge ...

Trie树的分析与实现

Trie树的分析与实现的更多相关文章

随机推荐

热门专题