[题意] 给定一个长为n的序列,元素都是不超过88的正整数,求序列中主题的最大长度. 所谓主题是指在序列中出现了至少两次并且不相交的子串.特别的,主题可以变调,也就是说如果一个子串全部加上或减去一个数后与另一个子串相同,那么也认为它们是相同的. 对于100%的数据,n<=5000. [解法] 所谓的变调不过是升降趋势相同,直接来一发差分就好. 答案显然有单调性,长度越长主题越不容易出现,因此可以二分答案,每次只要查询长为ans的子串中是否存在相同且不相交的两个子串即可. 查询子串是否相同可以用哈…
主题模型 LDA 入门(附 Python 代码)   一.主题模型 在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(Topic Model)能够识别在文档里的主题,并且挖掘语料里隐藏信息,并且在主题聚合.从非结构化文本中提取信息.特征选择等场景有广泛的用途. 主题可以被定义为“语料库中具有相同词境的词的集合模式”,比如说,主题模型可以 将“健康”,“医生”,“病人”,“医院” 集合成 “医疗保健” 主题 将 “农场”,“玉米”,“小麦…
程序设计入门第四讲练习题题解--数论入门 对于新知识点的学习,需要不断地刷题训练,才能有所收获,才能更好地消化知识点. 题组链接: 程序设计入门第四讲练习题--数论 by vjudge 题解: A. Goldbach`s Conjecture(LightOJ - 1259)[简单数论][筛法] B. 七夕节 (HDU - 1215) [简单数论][找因数] C. Least Common Multiple (HDU - 1019) [简单数论][LCM][欧几里得辗转相除法] D.Sigma F…
Description 我们用N(1 <= N <=5000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,每个数表示钢琴上的一个键.很不幸这种表示旋律的方法忽略了音符的时值,但这项编程任务是关于音高的,与时值无关. 许多作曲家围绕一个重复出现的“主题”来构建乐曲.在我们的乐曲表示法中,“主题”是整个音符序列的一个子序列,它需要满足如下条件: 长度至少为5个音符 在乐曲中重复出现(可能经过转调,见下) 重复出现的同一主题不能重叠 “转调”的意思是主题序列中每个音符都被加上或减…
如果你已经确保自己的hash技巧已经入门,那么请左转这篇博文 首先介绍一下hash? 事实上是一种叫做蛤丝的病毒 以下讲到的hash都是OI中最常用到的hash方法:进制哈希 做法: 首先设一个进制数base,并设一个模数mod 而哈希其实就是把一个数转化为一个值,这个值是base进制的,储存在哈希表中,注意一下在存入的时候取模一下即可 比如说现在有一个字符串orzc 枚举这个字符串的每一位,与base相乘得到ans,然后mod一下,就得到orzc的哈希值 但是哈希有一个很大的弊端: 哈希冲突…
Hash:一般是一个整数.就是说通过某种算法,可以把一个字符串"压缩" 成一个整数.一,题意: 给出两个数n,nc,并给出一个由nc种字符组成的字符串.求这个字符串中长度为n的不同子串有多少种?二,思路: 1.这个题不用匹配,因为不高效. 2.将长度为n的子串看作n位的nc进制数,将问题转化为共有多少种十进制数字. 3.哈希时,每一个字符都对应这0 ~ nc-1的一个数字.三,步骤: 1.给nc个字母编号:0 ~ nc-1 hashArray[ch[i]] = k++; 2.明确每n个…
Problem Description 哈利波特在魔法学校的必修课之一就是学习魔咒.据说魔法世界有100000种不同的魔咒,哈利很难全部记住,但是为了对抗强敌,他必须在危急时刻能够调用任何一个需要的魔咒,所以他需要你的帮助. 给你一部魔咒词典.当哈利听到一个魔咒时,你的程序必须告诉他那个魔咒的功能:当哈利需要某个功能但不知道该用什么魔咒时,你的程序要替他找到相应的魔咒.如果他要的魔咒不在词典中,就输出“what?” Input 首先列出词典中不超过100000条不同的魔咒词条,每条格式为: [魔…
简单介绍一下字符串hash 相信大家对于hash都不陌生 翻译过来就是搞砸,乱搞的意思嘛 hash算法广泛应用于计算机的各类领域,像什么md5,文件效验,磁力链接 等等都会用到hash算法 在信息学奥赛中,hash算法主要应用于搜索状态判重,字符串的比较等 hash的主要思想是:对于一个空间.时间需求较大的状态,在一定错误率的基础上进行状态压缩,降低其时间.空间的需求量 对于字符串hash来说,就是把一串字符串压缩成一个hash值,方便我们进行数据的处理 接下来我们重点讲一下字符串hash的实现…
正解:SA 解题报告: 传送门 这题三个条件嘛,那就一个个考虑下都解决了就把这题解决了嘛QwQ 那就直接分别针对三个条件写下各个击破就欧克辣? 1)长度大于等于5:求出答案之后和5比大小 2)不能有公共部分:记录连续的满足hei>=d的子串的SA,如果max-min>=d就说明没有公共部分了 3)在乐曲中重复出现(可能经过转调:做个差就是一样儿的了 那就先跑个SA然后二分一下长度,check就是判断有麻油连续的满足hei>=d的满足SA的max-min>d 然后就做完了,,, #i…
题目链接:戳我 Emmm......hash怎么做啊不会啊 这里是SA后缀数组版本的 就是先两两做差分,作为要处理后缀的数组.普通地求出来h数组之后,我们二分这个答案,然后判定是否合法就行了.是否合法即\(min(sa[j])+h[i]<max(sa[j]),j<=i\) 代码如下: #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> #include…