自动完成 APP

传送门  来源:upc12786

题目描述

奶牛 Bessie 很喜欢用手机上网聊天,但她的蹄子太大,经常会按到好几个键造成不必要的麻烦(丢死人了,你下辈子还是不要当奶牛了)。于是 Farmer John 给她专门设计了一套「自动完成 APP」。这个 APP 能够连接到在线词典来获取词库(词库的来源是 Bessie 常用的 n 个单词),并且有着自动补全的功能。当 Bessie 想打出她的一个常用单词时,她只需输入这个单词的某个前缀,并询问词库中拥有这个前缀的字典序第 k 小的单词,APP 就会返回这是词库中的第几个单词。

Farmer John 是个大忙人,所以编写 APP 的任务自然就交给了你。

输入

第一行两个整数 n,m,表示词库的单词个数和 Bessie 的询问次数。

接下来 n 行,每行一个字符串,表示 Bessie 的常用单词,输入的第 i 个字符串在词库中编号为 i。

接下来 m 行,每行一个整数 k 和一个字符串 S,表示 Bessie 的询问,意义是询问词库中以 S 为前缀的字典序第 k 小的单词在词库中的编号。

输出

对于每次询问输出一个整数,表示以S为前缀的字典序第 k 小的单词在词库中的编号;如果不存在这样的单词,输出 −1。

样例输入

10 3
dab
ba
ab
daa
aa
aaa
aab
abc
ac
dadba
4 a
2 da
4 da

样例输出

3
1
-1

提示:

(1) 以 a 为前缀的单词有 {aa,aaa,aab,ab,abc,ac},其中字典序第 4 小的是 ab,是词库的第 3 个单词。

(2) 以 da 为前缀的单词有 {daa,dab,dadba},其中字典序第 2 小的是 dab,是词库的第 1 个单词;没有第 4 小的单词。

对于 20% 的数据,1≤ 词库的字母总量,询问的字母总量 ≤103。

对于 100%的数据,1≤ 词库的字母总量,询问的字母总量 ≤106,保证词库里的单词两两不同,所有字符串只包含小写字母。

思路:

如果对字典树有了解,开始能感觉到是个字典树的板子题加上dfs能解决,但TLE。

看了题解,先用字典树把所有单词存起来,再跑一次dfs给每个单词的结尾附上id(连续的),就可以直接求了,具体看解析。

思路解析:(输入单词:dab ba ab daa aa aaa)

1、建立字典树(具体怎么建字典树:浅谈Trie树(字典树)写的很好)

用sum数组记录每个点是几个单词的前缀,例如sum[4]=1。

如果单词结束还要用flag1数组表示他是第几个单词,便于最后输出,例如flag1[10]=6(因为他是第六个单词嘛)。

这两点在建字典树的时候经常用到,不难理解。

上图中红色点表示其上面字符串构成了一个单词。

2、dfs给红色点赋id(蓝色数字为赋给的id,有规律便于结题)

蓝色的数字表示赋给的id,存入数组num中,如果是红点的话还要用数组dir存入其root值(root值就是圈中心的数字)。

例如 root=3时 id=6  则:

num[3]=6   dir[6]=3;

root=1 时 id=5

只需要num[1]=5而不需要存入dir数组中,因为root不是红点。

3.1、根据输入的字符串判断是否有存在单词满足该前缀的可能性

例如输入:1 fffffff (这不是乔碧萝殿下的坦克!!)

从图中可以看出不可能构成单词,可以直接输出-1。

3.2、如果满足条件,返回root的值

例如输入:3 b

返回root的值: 4 判断sun[4]和k的大小关系,如果不满足输出-1。

4、如果上面条件不能输出-1,那就意味着肯定能找到第k小的单词。

直接输出flag1[ dir[ num[ root ] + k - 1 ] ]就是结果。我当时就看到就很懵逼,但分析完这个公式你会感觉整个解题思路超级紧密。

分析公式:flag1[ dir[ num[ root ] + k - 1 ] ]

1、num[ root ] + k - 1 表示的是一个数的 id

2、把id放进num[ ]中即 num[id]是不是就表示这个数的root值

3、再把root放进flag1[]中即flag1[root]是不是表示第几个输入的单词

类似链式前向星的head数组和edge数组的关系,就是很巧妙。

分析完公式,超级佩服这个思路,感谢:溺生

AC代码:

#include<bits/stdc++.h>
using namespace std;
const int MAX=1e6;
int trie[MAX+5][35];
char a[MAX+5];
int n,m,k;
int top;
int flag[MAX+5],flag1[MAX+5],num[MAX+5],dir[MAX+5];
int sum[MAX+5];
void Insert(char a[],int k1) ///建字典树
{
int la=strlen(a);
int root=0;
for(int i=0;i<la;i++){
int id=a[i]-'a';
if(!trie[root][id]) trie[root][id]=++top;
sum[trie[root][id]]++;
root=trie[root][id];
}
flag[root]=1; ///标记该root点有单词结束
flag1[root]=k1; ///给root点赋输入的顺序,便于输出
}
int cnt;
void dfs(int res) ///dfs给所有的root点赋上图id值
{
if(flag[res]){
dir[++cnt]=res;
num[res]=cnt;
}else{
num[res]=cnt+1;
}
for(int i=0;i<26;i++){
if(trie[res][i]){
dfs(trie[res][i]);
}
}
}
int Find(char a[])///判断输入的前缀是不是有构成单词的可能性,如果有返回最后的root值,没有返回-1
{
int la=strlen(a);
int root=0;
for(int i=0;i<la;i++){
int id=a[i]-'a';
if(!trie[root][id]){
return -1;
}
root=trie[root][id];
}
return root;
} int main()
{
scanf("%d%d",&n,&m);
for(int i=0;i<n;i++){
scanf("%s",a);
Insert(a,i+1);
}
dfs(0);
for(int i=0;i<m;i++){
scanf("%d%s",&k,a);
int res=Find(a);
if(res==-1){
printf("-1\n");
}else{
if(sum[res]<k){
printf("-1\n");
}else{
printf("%d\n",flag1[dir[num[res]+k-1]]);///输出结果
}
}
}
return 0;
}

自动完成 APP【字典树(Trie树)+dfs】的更多相关文章

  1. 字典树(Trie树)的实现及应用

    >>字典树的概念 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树.与二叉查找树不同,Trie树的 ...

  2. [POJ] #1002# 487-3279 : 桶排序/字典树(Trie树)/快速排序

    一. 题目 487-3279 Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 274040   Accepted: 48891 ...

  3. Atitit 常见的树形结构 红黑树  二叉树   B树 B+树  Trie树 attilax理解与总结

    Atitit 常见的树形结构 红黑树  二叉树   B树 B+树  Trie树 attilax理解与总结 1.1. 树形结构-- 一对多的关系1 1.2. 树的相关术语: 1 1.3. 常见的树形结构 ...

  4. luoguP6623 [省选联考 2020 A 卷] 树(trie树)

    luoguP6623 [省选联考 2020 A 卷] 树(trie树) Luogu 题外话: ...想不出来啥好说的了. 我认识的人基本都切这道题了. 就我只会10分暴力. 我是傻逼. 题解时间 先不 ...

  5. 洛谷$P4585\ [FJOI2015]$火星商店问题 线段树+$trie$树

    正解:线段树+$trie$树 解题报告: 传送门$QwQ$ $umm$题目有点儿长我先写下题目大意趴$QwQ$,就说有$n$个初始均为空的集合和$m$次操作,每次操作为向某个集合内加入一个数$x$,或 ...

  6. [转载]字典树(trie树)、后缀树

    (1)字典树(Trie树) Trie是个简单但实用的数据结构,通常用于实现字典查询.我们做即时响应用户输入的AJAX搜索框时,就是Trie开始.本质上,Trie是一颗存储多个字符串的树.相邻节点间的边 ...

  7. Luogu P2922 [USACO08DEC]秘密消息Secret Message 字典树 Trie树

    本来想找\(01Trie\)的结果找到了一堆字典树水题...算了算了当水个提交量好了. 直接插入模式串,维护一个\(Trie\)树的子树\(sum\)大小,求解每一个文本串匹配时走过的链上匹配数和终点 ...

  8. 字典树 trie树 学习

    一字典树 字典树,又称单词查找树,Trie树,是一种树形结构,哈希表的一个变种   二.性质 根节点不包含字符,除根节点以外的每一个节点都只包含一个字符: 从根节点到某一节点,路径上经过的字符串连接起 ...

  9. 【字符串算法】字典树(Trie树)

    什么是字典树 基本概念 字典树,又称为单词查找树或Tire树,是一种树形结构,它是一种哈希树的变种,用于存储字符串及其相关信息. 基本性质 1.根节点不包含字符,除根节点外的每一个子节点都包含一个字符 ...

  10. 字典树 Trie树

    什么是Trie树? 形如 其中从根节点到红色节点的路径上的字母所连成的字符串即为一个Trie树上所存的字符串. 比如,这个trie树上有ab,abc,bd,dda这些字符串. 至于怎么构建和查找或添加 ...

随机推荐

  1. 关于php中数据提交到当前页面action的问题

    关于php中数据提交到当前页面action的问题 2011-06-21 17:45杨超★杰伦 | 分类:PHP | 浏览695次 php中数据提交到当前页面,有人action=“<?php ec ...

  2. 每次找Internet选项感到抓狂?一键打开!

    WIN+R运行,输入inetcpl.cpl,就可以打开了!

  3. Gym101630L Laminar Family

    题目链接:https://cn.vjudge.net/problem/Gym-101630L 题目大意: 对于一个集合的集合,若其中任意两个集合 \(A\) 和 \(B\) 都满足下述三个条件之一:\ ...

  4. Hystrix入门

    hystrix对应的中文名字是“豪猪”,豪猪周身长满了刺,能保护自己不受天敌的伤害,代表了一种防御机制,这与hystrix本身的功能不谋而合,因此Netflix团队将该框架命名为Hystrix,并使用 ...

  5. centos安装以及网络配置

    Linux安装 1.Linux安装完成后 第一个问题就是网络不通的问题 ,问题图片如下: 解决办法: 三种网络模式: 桥接模式:虚拟机和宿主机是兄弟关系,统一由宿主机连接的路由器分发ip NAT模式: ...

  6. Java IO(十) BufferedInputStream 和 BufferedOutputStream

    Java IO(十)BufferedInputStream 和 BufferedOutputStream 一.BufferedInputStream 和 BufferedOutputStream (一 ...

  7. 动态生成Person类的对象 代码参考

    #include <iostream> #include <string> using namespace std; class Person { private: strin ...

  8. idea本地Maven仓库不能下载依赖jar包的解决方案

    1.确认maven是否正正常安装,是否配置了环境变量,可以通过命令 mvn -version 看是否显示maven的版本信息. 2.检查maven的setting.xml配置文件中本地仓库位置配置是否 ...

  9. 用java方式实现快速排序

    一.基本思想 快速排序采用分治的策略,具体如下:选择一个关键值作为基准值,找到一个元素小于比基准值小的都在左边序列(一般是无序的),比基准值大的都在右边(一般是无序的).一般选用序列第一个元素作为基准 ...

  10. 树莓派 Ubuntu Mate更换中国软件源

    更换步骤: 1.以root身份打开 /etc/apt/sources.list ,可以用vim或者nano 2.将 http://ports.ubuntu.com/ 全部替换为 http://mirr ...