树上启发式合并

DSU on tree，我也不知道DSU是啥意思

这是一种看似特别玄学的优化

可以把树上部分问题由 $O(n^2)$ 优化到 $O(n \log n)$。

例如 CodeForces 600E。

又例如一道神奇的题：

适用情况

可以离线的部分树上问题。

需要子树上的所有信息，但是信息无法快速合并的情况。

或者说可以使用树上莫队的题目一般都可以使用启发式合并？（至少OI-Wiki是这么说的）

树上启发式合并并不是很常用

合并思路

首先定义一点概念：

重子节点：一个结点的子结点中度最大的结点（孩子个数最多的点）
轻子节点：非重子节点的节点
重边：重子结点（如果有）与其父结点相连的边
轻边：非重边
重链：相邻重边链接形成的链（这里好像用不到）

树上启发式合并的思路如下：

处理 x 为根的情况
递归处理 轻子节点 的答案，并舍弃其信息
处理 重子节点 的答案，并保留其信息
如果 x 为（其父亲的）重子节点，则加上所有 轻子节点 的信息。否则舍弃其信息

很明显，我们需要预处理出重子节点。同时可能需要用到 dfn 序来优化信息的加入

不妨我们以 vector 存图（非常方便）
void workSon(int x, int f) {

    siz[x] = 1, fa[x] = f;

    dfn[x] = ++cdfn, rdfn[cdfn] = x;

    for (int y : G[x]) {

        if (dfn[y]) continue;

        workSon(y, x);

        siz[x] += siz[y];

        if (siz[son[x]] < siz[y]) son[x] = y;

    }

    edfn[x] = cdfn;

}
最终 son[x] 就是 x 的重子节点，同时我们处理出了 dfn 序以及以 x 为子树的 dfn 序范围：[dfn[x], edfn[x]] 注意为闭区间

那么伪代码大致如下：

// remain 用于获知需不需要保留数据，默认不保留

int currentAnswer;

void work(int x, bool remain = false) {

    for (int y : G[x]) {

        if (y != fa[x] && y != son[x]) work(y);

    }

    if (son[x]) work(son[x], true);

    for (int y : G[x]) {

        if (y == fa[x] || y == son[x]) continue;

        addSubTreeInfoAndUpdateAnswer(y);

    }

    answerOf[x] = currentAnswer;

    if (!remain) {

        clearAnswer();

        for (int y : G[x]) {

            if (y != fa[x]) removeSubTreeInfo(y);

        }

    }

}

每个部分的作用在函数名里面应该很清晰了。这里不再赘述。

复杂度证明

首先，根节点到树上任意节点的轻边数不超过 $\log n$ 条。

只有当祖先节点为轻子节点时其信息会被删除。也就是加入 $O(\log n)$ 次，删除 $O(\log n)$ 次，故而每一个点的复杂度为 $O(\log n)$，整体的复杂度为 $O(n \log n)$。

当然，考虑如果每一个节点加入信息或者删除信息的复杂度为 $O(k)$，则整体复杂度为 $O(n k \log n)$。

非常玄学……但是就是能够优化

例题分析

就以开始为例子的两道题为例吧。

CodeForces 600E

这道题也就是树上数颜色的问题。

题目大意是：

对于每一个节点，做出贡献的颜色需要满足出现的次数是最多的之一。一个颜色的贡献即是这个颜色的编号。

最终输出每一个节点被贡献的结果

最主要也是最重要的就是颜色的统计。

加入点（颜色）的核心代码如下：

int colorBut[N];

long long maxExi = 0, cnt = 0;

void add(int c) {

    if (++colorBut[c] == maxExi) {

        cnt += c;

    } else if (colorBut[c] > maxExi) {

        maxExi = colorBut[c], cnt = c;

    }

}

在合并部分也很清晰了

long long res[N];

void dsu(int x, int f, bool remain = false) {

    for (int y : G[x]) {

        if (y != f && y != son[x]) dsu(y, x);

    }

    if (son[x]) dsu(son[x], x, true);

    // 记得把根节点的信息也加进去！

    add(col[x]);

    for (int y : G[x]) {

        if (y == f || y == son[x]) continue;

        // 添加信息

        for (int i = dfn[y]; i <= edfn[y]; ++i) add(col[rdfn[i]]);

    }

    res[x] = cnt;

    if (!remain) {

        maxExi = cnt = 0; // 重置答案

        for (int i = dfn[x]; i <= edfn[x]; ++i) // 删除影响信息

            colorBut[col[rdfn[i]]] = 0;

    }

}

不正常国家

这道题稍微复杂一点。

考虑每对点对其 LCA 的贡献。或者换个思路，考虑每一个根节点能够被那些点贡献。

不难发现，有两种情况：

LCA 和其子节点之间的路径
LCA 的两个子节点之间的路径。这里要保证两个子节点在不同的子树里面。

如果我们已经预处理出了树上异或前缀和 path。那么任意两个点对其 LCA 的贡献为 path[x] ^ path[y] ^ val[LCA]。我们不妨对于每一个 LCA，枚举所有 path[y] ^ val[LCA]，同时在已知的 path[x] 中匹配最大的异或对。

最大异或对可以看此题：AcWing 143.最大异或对

利用了01Trie树和二进制贪心。

此处不展开。

同时，由于我们需要保证 x 和 y 在 u 的不同子树中，所以我们先查询完一颗子树再加入这棵子树的信息。

核心代码如下：

// 树上启发式合并

void work(int x, int f, bool remain = false) {

    // 首先搞定所有非重子节点

    for (int y : G[x]) {

        if (y == f || y == son[x]) continue;

        work(y, x);

    }

    // 搞定重子节点，并保留数据

    if (son[x]) work(son[x], x, true);

    // path[fa[x]] 也就是 path[x] ^ val[x]

    int ans = max(val[x], trie.pairMax(path[fa[x]]));

    trie.insert(path[x]);

    // 加入其他节点，并搜索

    for (int y : G[x]) {

        if (y == f || y == son[x]) continue;

        for (int j = dfn[y]; j <= edfn[y]; ++j) {

            int pa = path[rdfn[j]] ^ val[x];

            ans = max(ans, trie.pairMax(pa));

        }

        for (int j = dfn[y]; j <= edfn[y]; ++j) {

            trie.insert(path[rdfn[j]]);

        }

    }

    res[x] = ans;

    if (!remain) trie.clear();

}

至于 01Trie 树代码如下：

const int LOG = 30; // 31位！下标为 [0, 30]

#define bit(x, i) ((x >> i) & 1)

class Trie01 {

private:

    int ch[N << 4][2];

    int usage;

public:

    Trie01() : usage(1) {

    }

    inline int newNode() {

        ++usage;

        ch[usage][0] = ch[usage][1] = 0;

        return usage;

    }

    void insert(int x) {

        int p = 1;

        for (int k = LOG; k >= 0; --k) {

            int s = bit(x, k);

            if (!ch[p][s]) ch[p][s] = newNode();

            p = ch[p][s];

        }

    }

    // 这是通过树的形状贪心寻找最大异或对

    int pairMax(int x) {

        int p = 1;

        int r = 0;

        for (int k = LOG; k >= 0; --k) {

            int s = bit(x, k) ^ 1;

            if (ch[p][s]) r = (r << 1) | 1, p = ch[p][s];

            else if (ch[p][s ^ 1]) r <<= 1, p = ch[p][s ^ 1];

            else p = 0, r = x; // 避免空树的情况

        }

        return r;

    }

    void clear() {

        usage = 1;

        ch[1][0] = ch[1][1] = 0;

    }

} trie;

那么这道水题也就这么水过去了。

忘了说，其复杂度为 $O(n \log n L)$，其中 $L$ 是位长，也就是代码中的 LOG = 30。所以复杂度也可以写为 $O(n \log^2 n)$

树上启发式合并的潜力不止于此，还望诸君发掘。

算法学习笔记(19): 树上启发式合并（DSU on tree）的更多相关文章

神奇的树上启发式合并 (dsu on tree)
参考资料 https://www.cnblogs.com/zhoushuyu/p/9069164.html https://www.cnblogs.com/candy99/p/dsuontree.ht ...
树上启发式合并 (dsu on tree)
这个故事告诉我们,在做一个辣鸡出题人的比赛之前,最好先看看他发明了什么新姿势= =居然直接出了道裸题参考链接: http://codeforces.com/blog/entry/44351(原文) ...
【CF600E】Lomset gelral 题解（树上启发式合并）
题目链接题目大意:给出一颗含有$n$个结点的树,每个节点有一个颜色.求树中每个子树最多的颜色的编号和. ------------------------- 树上启发式合并(dsu on tree). ...
树上启发式合并（dsu on tree）学习笔记
有丶难,学到自闭参考的文章: zcysky:[学习笔记]dsu on tree Arpa:[Tutorial] Sack (dsu on tree) 先康一康模板题吧:CF 600E($Lomsat ...
dsu on tree 树上启发式合并学习笔记
近几天跟着dreagonm大佬学习了$dsu\ on\ tree$,来总结一下: $dsu\ on\ tree$,也就是树上启发式合并,是用来处理一类离线的树上询问问题(比如子树内的颜色种数) ...
【学习笔记/题解】树上启发式合并/CF600E Lomsat gelral
题目戳我 $\text{Solution:}$ 树上启发式合并,是对普通暴力的一种优化. 考虑本题,最暴力的做法显然是暴力统计每一次的子树,为了避免其他子树影响,每次统计完子树都需要清空其信息. ...
dsu on tree (树上启发式合并) 详解
一直都没出过算法详解,昨天心血来潮想写一篇,于是 dsu on tree 它来了 1.前置技能 1.链式前向星(vector 建图) 2.dfs 建树 3.剖分轻重链,轻重儿子重儿子一个结点的所有 ...
【Luogu U41492】树上数颜色——树上启发式合并（dsu on tree）
(这题在洛谷主站居然搜不到--还是在百度上偶然看到的) 题目描述给一棵根为1的树,每次询问子树颜色种类数输入输出格式输入格式: 第一行一个整数n,表示树的结点数接下来n-1行,每行一条边接下 ...
树上启发式合并（dsu on tree)
树上启发式合并属于暴力的优化,复杂度O(nlogn) 主要解决的问题特点在于: 1.对于树上的某些信息进行查询 2.一般问题的解决不包含对树的修改,所有答案可以离线解决算法思路:这类问题的特点在于父 ...
CF741D Arpa’s letter-marked tree and Mehrdad’s Dokhtar-kosh paths 树上启发式合并（DSU ON TREE）
题目描述一棵根为$1$ 的树,每条边上有一个字符($a-v$共$22$种). 一条简单路径被称为$Dokhtar-kosh$当且仅当路径上的字符经过重新排序后可以变成一个回文串. 求 ...

随机推荐

Flink Heartbeat of TaskManager和Heartbeat of ResourceManager timed out问题
最近上了个Flink任务,运行一段时间后就自动停止了,很是郁闷,查看最后一个chekpoint时间点,翻看时间日志 2019-12-13 07:25:24.566 flink [flink-akka. ...
Linux系统安装&VMware安装三
第十四步: 开始安装
前端面试问题整理（html和css部分）
html5新增属性有哪些? 如何理解语义化标签? 你如何看待前端模块化的? 如何看待前后端分离? 浏览器兼容性问题? 你知道的行内元素.块级元素有哪些? css部分: 1.为什么要初始化css样式? ...
oracle 实例无法启动和初始化
1 先看oracle的监听和oracle的服务是否都启动了.启动oracle监听:cmd的命令行窗口下,输入lsnrctl start,回车即启动监听.2 查看oracle的sid叫什么,比如创建数据 ...
esxi的一些命令
今天本想在vcenter上建个分布式交换机,没想到在迁移主机端口时,由于主机只连了一个物理网卡,导致在迁移到分布式交换机而失去连接,几近周折,从网上找了几篇不错的文章,与众同乐假如一台ESX主机先通 ...
jmeter中使用csv文件时设置编码
1.新建XLS文件,另存为CSV格式文件 2.在jmeter中可以尝试将编码设置成GB2312,或者utf-8
docker知识篇
什么是Docker?Docker是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的.可移植的.自给自足的容器.开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署,包括VMs(虚拟机).b ...
go tour 笔记 day1
go get 访问github太慢需要配置代理,设置环境变量 http_proxy=http://127.0.0.1:xxxx 算是比较方便的一种 ref: https://blog.csdn.net ...
oracle中的merge into用法解析
一:merge into的形式 MERGE INTO [target-table] A USING [source-table sql] B ON([conditional expression] a ...
OO_Lab0总结博客
OO_Lab0 问题描述对表达式结构进行建模,将表达式中非必要的括号进行展开并化简. 设定的形式化表述(仅写出部分): 表达式 $\rightarrow$ 空白项 [加减空白项] 项空白项 ...

算法学习笔记(19): 树上启发式合并（DSU on tree）