出游回来自然而然(?)地进入生产低谷的兔子只能写写游记了 qwq. Day -1 实时反馈赛制不是为防止你被数据调戏,而是给你调戏数据的机会. --鲁迅   PKU 一贯的 \(32\) 发提交实时反馈取 \(\max\) 的计分规则让我们被迫干起考试前一天做随机乱搞题的掉人品之为.(   欸这个,[NOI2008] 赛程安排,快乐调参 + 挂机颓废 + 交流取经,玩了一下午,凭借爆发的"兔品"(?)搞到全机房最高的 \(91\text{pts}\),就挺嗨.   糟糕糟糕,考前随…
目录 浅谈NLP 文本分类/情感分析 任务中的文本预处理工作 前言 NLP相关的文本预处理 浅谈NLP 文本分类/情感分析 任务中的文本预处理工作 前言 之所以心血来潮想写这篇博客,是因为最近在关注NLP文本分类这类任务中的文本预处理工作,想总结一下自己的所学所想,老规矩,本博文记载仅供备忘与参考,不具备学术价值,本文默认使用python3编程(代码能力是屎山级别的,请谅解),默认文本为英文,代码主要使用Pytorch(博主老笨蛋了,之前一直执迷不悟用Keras,现在刚刚开始用torch,怎么说…
  大概只有比较有意思又不过分超出能力范围的题叭.   可是兔子的"能力范围" \(=\varnothing\) qwq. 「CF 1267G」Game Relics   任意一个状态可以描述为 \((m,s)\),表示剩下 \(m\) 个·总价值为 \(s\) 的物品未选.若当前决策为 X 操作,那么由于决策的确定性,我们必然不停 X 直到出货.所以代价为 \[\frac{x}{2}\left(\frac{n}{m}+1\right), \] 若当前决策为 C 操作,代价则为 \(\…
最近写了几道AC自动机的题.这几题主要考察的是对AC自动机的浅层理解套上计数. 几道计数题 [AC自动机]bzoj3172: [Tjoi2013]单词 把被动贡献看成主动贡献. [状态压缩dp]1195: [HNOI2006]最短母串 一种做法是dp:另一种是AC自动机+BFS. 与下一题的对比在于要求包含所有串. 2938: [Poi2000]病毒 问题可以看做:一个串在AC自动机上无限匹配而不遇到终止节点. 那么在构造fail时,就可以把fail边连向终止节点的节点标记一下. 这应该是一种常…
雨幕浓稠 远近一白 是水雾弥漫的天 还是泡沫撑起的海   雨真大呢.   前几天去 ZH 中学集训没啥好记的,就从会合日开始叭. [Day -1]   逃出 ZH,掉入梦麟.(   高中的同学们忘记带各种证明了啊,进门时罚站了好久,雨里实在站不住了才去签到.领了背包(还没拆封).两件衣服(挺好看 w).纪念笔(还是没拆封)--顺便在签名墙上留下了一个大号但写失误了的 "Rainybunny"(真的啊花体写 "unny" 巨难感知到底弧了几下 qwq)和一个小号但比较…
每次询问[l,r]区间,但所有信息是按另一种序列给出的,因此无法使用区间数据结构做这种题.将每个询问改为[1,x],考虑离线,则从1~n依次修改并查询即可. BZOJ3626 给定一颗树,每次询问给定l,r,x,求\(\sum_{u=l}^rdpt[lca(u, z)]\). 每次询问相当于将l~r的点到根节点的每条路径上的点+1,然后查z到根节点的路径的和. 用上述方法做即可.即依次将1~n的点到根节点的每条路径上的点+1,同时统计答案.…
题目链接 戳我 \(Solution\) 我们将现在所要进行的数设为\(now\) 我们分情况讨论一下 他自己不翻倍 他自己翻倍 我们首先来看看\(1\)操作 如果要满足他对排名没有影响,那么不能进行翻倍的数只有\([\lceil\frac{now}{2}\rceil,now]\).(我考场上不知道在干吗,写的是能进行翻倍的数,麻烦好多,常数也大).我们假设这一段为\(cnt\)个,那么这一段的答案就是: \[C_{n-cnt}^{k}\] 再来看看\(2\)操作 如果我们要讲\(now*2\)…
\(\mathscr{Description}\)   Link. (It's empty temporarily.)   给定排列 \(\{a_n\}\),\(q\) 次询问,每次给出 \([l,r]\),求升序枚举 \(a_{l..r}\) 时下标的移动距离.   \(n,q\le5\times10^5\). \(\mathscr{Solution}\)   我写了个不加莫队,它慢死了.   我写了个 Ynoi 风格的纯纯分块预处理,它慢死了.   我写了个 polylog 的正解,它还是慢…
我们经常会发现网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念, 动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器后动态生成的,而之前并没有的. 在编写爬虫进行网页数据抓取的时候,经常会遇到这种需要动态加载数据的HTML网页,如果还是直接从网页上抓取那么将无法获得任何数据. 今天,我们就在这里简单聊一聊如何用python来抓取页面中的JS动态加载的数据. 给出一个网页:豆瓣电影排行榜,其中的所有电影信息都…
采用VSTO或者Shared Add-in等技术开发Excel插件,其实是在与Excel提供的API在打交道,Excel本身的组件大多数都是COM组件,也就是说通过Excel PIA来与COM进行交互.这其中会存在一些问题,这些问题如果处理不好,通常会导致在运行的时候会抛出难以调试的COM异常,从而导致我们开发出的Excel插件的不稳定. 和普通的WinForm程序一样,Excel也是一种STA(Single Thread Apartment)线程的应用程序,Excel插件是寄宿在Excel中运…