抱歉更新晚了,看了几天三体,2333,我们继续数据结构之旅。

一.什么是Tire树?

Tire树有很多名字:字典树、单词查找树。 故名思意,它就是一本”字典“,当我们查找"word"单词时,先找到w开头的词汇,再继续往下找到o开头的词汇,依次类推。

特点:

  1)除去根节点外的所有节点都有一个字符

  2)兄弟节点的字母各不相同

  3)从根到某一字符经过的所有字符拼接成一个 ”单词“ 或者 ”单词前缀“

例如:

很显然,Trie是空间换时间的操作,通过字符串公共前缀降低查询开销。

二.Trie树的应用场景。

Trie树用于 前缀匹配 和 范围查找 ,这些在搜索引擎等中可以用到。

但是用来匹配字符串的话,虽然也可以但是太鸡肋了。

例子:查找10W个字符串中是否存在某些字符串。

  思路1: 用hash分区,相同Hash值的分区进行匹配

  思路2: 用trie树,稳定的复杂度

现实是:

  hash:几乎所有语言都有现成库

  trie:你自己手写不靠谱的算法,或用一些压根不流行的包

所以用hash是99%的工程师会用的方法。至于为什么Java或其他语言不在语言库中扩展Trie:

  1)计算机中的字符太多,ASCII中只有128,但是Unicode中有65536个

  2)如果字符串数目过大,或者匹配的位数过多,都会占用很大的空间存储Trie树,Trie树的大小真的很可怕,这种情况下几乎不能用

三.Trie树的例子。

从10W个长度不超过10的字母的单词中,对每个单词,记录它首次出现的位置。

package ds7.trie;

public class Trie {
/**
* Trie树的顶点
*/
static class Vertex{
int firstPlace = -1;
Vertex[] vertices = new Vertex[26];
} /**
* Trie树
*/
static class TrieTree{
Vertex root = new Vertex(); /**
* 向某个节点插入单词/单词片段
* @param vertex
* @param word
*/
public void insertWord(Vertex vertex , String word, int firstPlace){
if(word.length() < 1){
return;
}
char ch = word.charAt(0);
ch = Character.toUpperCase(ch);
Vertex node = vertex.vertices[ch - 65];
if(node == null){
Vertex v = new Vertex();
v.firstPlace = firstPlace;
vertex.vertices[ch - 65] = v;
} insertWord(vertex.vertices[ch - 65], word.substring(1), firstPlace);
} /**
* 查找第一次出现的位置
* @param word
* @return
*/
public int getFirstPlace(String word){
int result = -1;
Vertex current = root;
for(char ch : word.toCharArray()){
ch = Character.toUpperCase(ch);
Vertex tmp = current.vertices[ch - 65];
if(tmp == null){
return -1;
}else{
current = tmp;
continue;
}
}
result = current.firstPlace;
return result;
}
} public static void main(String[] args) {
String[] words = new String[]{
"haha","java","word","python","word","c","scala","word",
}; TrieTree trieTree = new TrieTree();
for(int i = 0; i < words.length; i++){
trieTree.insertWord(trieTree.root,words[i],i);
} System.out.println("单词`word`首次出现在:" + trieTree.getFirstPlace("word"));
}
}

result:

单词`word`首次出现在:2

[数据结构] 2.3 Trie树的更多相关文章

  1. 数据结构与算法—Trie树

    Trie,又经常叫前缀树,字典树等等.它有很多变种,如后缀树,Radix Tree/Trie,PATRICIA tree,以及bitwise版本的crit-bit tree.当然很多名字的意义其实有交 ...

  2. [数据结构] P2.3 Trie树

    1.Trie树的概念 Trie树也叫做`字典树`或者`单词查找树`.用于字符串以及字符串元信息的快速查询. 例如:

  3. 可持久化数据结构(平衡树、trie树、线段树) 总结

    然而好像没有平衡树 还是题解包: T1:森林 树上主席树+启发式合并. 然而好像知道标签就没啥了.在启发式合并时可以顺手求lca 然而这题好像可以时间换空间(回收空间) T2:影魔 难点在于考虑贡献的 ...

  4. 数据结构《16》----自动补齐实现《一》----Trie 树

    1. 简述 Trie 树是一种高效的字符串查找的数据结构.可用于搜索引擎中词频统计,自动补齐等. 在一个Trie 树中插入.查找某个单词的时间复杂度是 O(len), len是单词的长度. 如果采用平 ...

  5. [转]数据结构之Trie树

    1. 概述 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. Trie一词来自retrieve,发音为/tr ...

  6. java实现的Trie树数据结构

    近期在学习的时候,常常看到使用Trie树数据结构来解决这个问题.比方" 有一个1G大小的一个文件.里面每一行是一个词.词的大小不超过16字节,内存大小限制是1M. 返回频数最高的100个词. ...

  7. 数据结构之Trie树

    1. 概述 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. Trie一词来自retrieve,发音为/tr ...

  8. 【数据结构】Trie树

    数据结构--Trie树 概念 Trie树,又称字典树.前缀树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计 ...

  9. 数据结构与算法简记--Trie树

    Trie树 概念 多叉树,节点为字符串中的单个字符. Trie 树的本质,就是利用字符串之间的公共前缀,将重复的前缀合并在一起. 将多个字符串按字符拆分插入Trie树,用于字符串查找,关键词提示等 举 ...

随机推荐

  1. 生产服务器上安装Python

    2018-05-17 生产环境的服务器(以下简称内网服务器)由于安全限制,可能无法连接外网.这种情况下将无法直接使用pip命令安装python的包 一.更改pip源 - 默认pip是使用Python官 ...

  2. mariadb数据库简介

    mariadb(默认端口3306) 什么是数据库? 白话:用来存放数据的仓库,这个仓库只不过是按照一定的数据结构来组织. 数据库模型分为三种: 层次式数据库 网络式数据库 关系型数据库和非关系数据库 ...

  3. Linux部署Redis及PHP-redis扩展

    Redis是一个key-value存储系统,属于我们常说的NoSQL.它遵守BSD协议.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API.它常用在缓存.队列.P ...

  4. Linux man学习

    5 man    man是manual的简写,Linux求助的工具    man  命令行,如 man  date 在我学习鸟哥私房菜的时候,也称man为man page  手册页入口:1 用户指令2 ...

  5. Mysql中event事件的入门

    Mysql中event事件的入门 主要涉及的知识点:mysql的存储过程.mysql的event事件调度. 参考资料: Qiao_Zhi的博客:[周期性执行事件]MySQL事件(Event)& ...

  6. mybatis 的 DefaultVFS 日志乱码问题

    mybatis 的 DefaultVFS 日志乱码问题 mybatis  DefaultVFS 乱码  1. 问题描述 今天在启动同事搭建的工程时,发现 console 中乱码,细看下,是 mybat ...

  7. 移动端 使用 vConsole调试

    前言 用vue 写移动端代码,有个报名页面 就在iOS 9下出现问题,vue的循环渲染都正常,一开始的数据也能取到.证明不是vue的兼容性问题 但是在用户点击按钮发现不能点击进入跳转 工具 推荐使用  ...

  8. Redux 聊聊

    前言 Redux 是 JavaScript 状态容器,提供可预测化的状态管理. 首先明确一点的就是: Redux并不是React必须的,也没有任何依赖,你可以很自由的将他应用到各种前端框架.jQuer ...

  9. vuex 管理状态

    来分析下vuex的管理状态吧,如果你用过react中的redux的管理树,那我觉得vuex对你来说很容易掌握 如果你还是不太熟悉vuex是什么,那先看下官网https://vuex.vuejs.org ...

  10. Hive 中的 LEFT SEMI JOIN 与 JOIN ON

    hive 的 join 类型有好几种,其实都是把 MR 中的几种方式都封装实现了,其中 join on.left semi join 算是里边具有代表性,且使用频率较高的 join 方式. 1.联系 ...