ZKW 非递归线段树详解

在算法竞赛和高性能计算场景中，线段树（Segment Tree） 是一个必修的数据结构。它可以在 $O(\log n)$ 时间内高效地完成区间查询与修改，比如：区间求和/最大/最小值查询配合区间加法/乘法/赋值操作。

经典线段树都是递归实现，即“从顶到底地去访问”整棵树。这种方式功能强大、可拓展性高，不过代码量稍大，实现起来相对“啰嗦”。运行时的函数递归开销大，尤其在多次深度递归调用时。

那么，是否有一种实现方式，可以去掉递归、保留高性能、更紧凑简洁？这时候，我们要介绍主角——zkw线段树。

什么是 zkw 线段树？

zkw 线段树的名称来源于一位中国信息学竞赛（由他发明）。这是一个 非递归实现的线段树结构。它的设计核心是：通过自底向上的迭代方式完成查询和修改操作。

相比传统递归线段树，zkw 在以下几个方面有明显优势：

完全去除递归，避免函数栈开销，这也使得常数极小，运行速度优于递归版约 10%~30%
逻辑紧凑，代码量少，对手写友好，非常适合比赛中快速实现；

当然，它也并非万能，当你需要支持更复杂的操作如区间乘法、赋值、合并区间信息时，他的结构不易再支撑复杂操作，改用传统递归线段树反而更灵活、更强大。

zkw 线段树的结构变化

zkw 线段树底层是如何组织数据的？其仍然用数组模拟一个二叉树。

zkw 线段树的核心思想仍是使用数组模拟一棵二叉树，将所有叶子节点排列在数组的下半部分，内节点放在上半部分，自底向上维护区间信息。按照提出者传下的惯例，通常将大小向上对齐到二的次幂（$N$ 是原数组大小，找一个大于等于 $N$ 的最小的 $2^k$，记为 $base$（通常为$2^{\lceil \log_2 N \rceil}$），保证线段树是一个完美二叉树。

整个线段树数组大小为 $2 * base$，惯例从 1 为根节点开始编号（有些实现从 0）；

位置	编号范围	说明
根节点	1	整个区间 [0, N-1]
内部节点	$[1, base - 1]$	管理子区间信息
叶子节点	$[base, base + N - 1]$	原数组元素对应位置

自底向上维护区间信息

zkw 的精妙之处在于：所有查询与更新操作都从叶子节点开始，向上合并区间信息。传统线段树从根节点出发，将一个区间拆分为对数个区间；而我们从目标区间的两个端点处的叶节点出发，也可以找到要拆分的区间。

为了进行区间拆分，我们想象两个指针在两个叶节点端点处，每一轮，如果左端点是一个左儿子，那么上跳（因为其父节点仍在区间内）；但如果左端点是一个右儿子，则其应该被单独拆分出来，讨论掉他后，左端点向右移（然后再上跳）。右端点同理。直到他们相遇，所有拆分的节点就是拆分出的子区间。

如图所示，假定要更新区间。访问 $[2, 10]$ 将最终被拆分为 4 个区间（红色节点），黄色为在范围内但由懒标记保护不用更新的大规模下层节点（被红色完全覆盖），而绿色则为会被红色节点影响，需要被 pushUp 的上层节点（同时也是经典线段树中根节点访问 $[2, 10]$ 的路径）。

zkw 线段树的实现

建树

计算出稍大于原数组的二次幂大小，构建二叉树。取原数组直接平移到叶节点处即可，然后生成非叶节点的和。

区间修改

对于拆分出的每个区间，都进行修改并更新懒标记（红点）。同时，绿点的总和值也会受到影响，所以他们需要被 pushUp（即两个叶节点到根节点路径上的所有点）

注意，pushUp 需要更新自身的值为子节点值之和+自身的懒标记。因为懒标记不总会被我们主动下推。

区间和

对于拆分出的每个区间，都直接统计其值（红点）。同时，绿点存在的懒标记也可能影响到总和，所以在正式求和之前，将他们全部下推到底（从两个叶节点到顶点路上的所有点，从上往下推下来）。

// 0-based 闭区间

class zkwSegmentTree {

    int n;                      // 实际元素个数

    int M;                      // 叶子起点（2 的幂）

    vector<long long> sum;

    vector<long long> lazy;

    vector<int> len;            // 每个结点管辖区间长度（不必须，也可以计算）

    inline void apply(int x, long long val) {

        sum[x]  += val * len[x];

        lazy[x] += val;

    }

    inline void pushUp(int x) {

        sum[x] = sum[x << 1] + sum[x << 1 | 1] + lazy[x] * 1LL * len[x];

    }

    inline void pushDown(int x) {

        if (lazy[x] == 0) return;

        apply(x << 1,     lazy[x]);

        apply(x << 1 | 1, lazy[x]);

        lazy[x] = 0;

    }

    // 把从根到 x 的路径上所有懒标记一层层下推

    inline void pushDownPath(int x) {

        static int stk[25];      // log2(2e5) ≈ 18，足够

        int top = 0;

        for (x >>= 1; x; x >>= 1) stk[top++] = x;

        while (top) pushDown(stk[--top]);

    }

public:

    explicit zkwSegmentTree(const vector<long long>& a) {

        n = (int)a.size();

        M = 1; while (M < n) M <<= 1;          // 2 的幂

        sum.assign(M << 1, 0);

        lazy.assign(M << 1, 0);

        len .assign(M << 1, 0);

        // 预计算区间长度

        for (int i = M; i < (M << 1); ++i) len[i] = 1;

        for (int i = M - 1; i; --i) len[i] = len[i << 1] + len[i << 1 | 1];

        // 叶子赋初值

        for (int i = 0; i < n; ++i) sum[M + i] = a[i];

        // 自底向上求和

        for (int i = M - 1; i; --i) sum[i] = sum[i << 1] + sum[i << 1 | 1];

    }

    void add(int l, int r, long long val) {

        int L = l + M, R = r + M;

        int l0 = L, r0 = R;            // 记录，待会儿 pushUp

        while (L <= R) {

            if (L & 1) apply(L++, val);    // 若 L 是右儿子，则整段属于答案

            if (!(R & 1)) apply(R--, val); // 若 R 是左儿子

            L >>= 1;  R >>= 1;

        }

        // 分别沿两条端点路径向上刷新，注意从最近祖先到根节点也需要更新

        for (int i = l0 >> 1; i; i >>= 1) pushUp(i);

        for (int i = r0 >> 1; i; i >>= 1) pushUp(i);

    }

    long long query(int l, int r) {

        int L = l + M, R = r + M;

        pushDownPath(L);

        pushDownPath(R);

        long long ans = 0;

        while (L <= R) {

            if (L & 1) ans += sum[L++];    // L 为右儿子，整段可取

            if (!(R & 1)) ans += sum[R--]; // R 为左儿子

            L >>= 1;  R >>= 1;

        }

        return ans;

    }

};

标记永久化方法

对于这道题来说（求和），除此在求和前下推所有需要的标记以外，还有一个思路：根本不下传标记，而是让标记永久停留在它被打下去的结点上，在真正需要它的那一刻——查询时——再即时计算它对答案的贡献。这个思路被称为标记永久化（Tag Persistence）。

具体来说在查询时，我们不使用 pushDownPath，而是现场计算每个绿点的懒标记对答案的贡献并累加。懒标记绝不往下传递，也不更新子结点。

对于上面代码，我们可以选择这样的写法：维护两组指针，一组正常向上分解区间，另外一组总是从边缘叶节点往上跳（保证他们覆盖所有的绿色节点），每次计算时，计算绿色节点持有的懒标记带来的贡献（懒标记值乘以左侧（或右侧）已计算的数的个数）。

long long range_query(int l, int r) {

    int L = l + M, R = r + M;

    // pushDownPath(L);

    // pushDownPath(R);

    int tl = L, tr = R, lc = 0, rc = 0;

    long long ans = 0;

    while (L <= R) {

        ans += lazy[tl] * lc + lazy[tr] * rc; // 计算本层的绿色节点懒标记

        if (L & 1) ans += sum[L++], lc += len[L - 1];

        if (!(R & 1)) ans += sum[R--], rc += len[R + 1];

        L >>= 1;  R >>= 1; tl >>= 1; tr >>= 1;

    }

    while (tl) { // 懒标记计算还要持续到根节点

        ans += lazy[tl] * lc + lazy[tr] * rc;

        tl >>= 1; tr >>= 1;

    }

    return ans;

}

按照这个思路，经典线段树实际上也可以在某些情况不推标记，只是不能带来任何好处。

开区间拆分法

其实原作者提出的区间拆分并非如此，原作者提出的思路是，将目标区间 $[L,R]$ 视作开区间 $(L-1,R+1)$，并在外侧的两个点开始向上。每一轮，如果左端点是一个左儿子，其右儿子被单独拆分，讨论掉他后上跳。右端点同理。直到他们互为兄弟，此时结束上跳。最后处理他们和他们的父节点（以及从父节点开始连接到根节点的更新）。

这种方法也很直观，不过需要额外处理目标区间由 0 开头或者在最后结束的情况（添加哨兵）

这种写法的代码略。

⚖️ 优点和劣势

特性	zkw 线段树	经典线段树	树状数组 (Fenwick)
更新复杂度	O(log n)	O(log n) (较大常数)	O(log n)
查询复杂度	O(log n)	O(log n) (较大常数)	O(log n)
常数开销	低（无下推一般较优，也无递归调用）	较高（函数递归＋下推）	极低（迭代加减）
代码简洁度	高	中	高（接口单一）
支持操作	区间加法、区间乘法等可叠加标记	任意可合并区间操作	仅点更新＋前缀和查询
复杂懒标记维护	★★☆☆☆	★★★★☆	—
扩展性	较差（赋值、多种标记叠加难）	最强（各种懒标记、区间合并）	差（只能单一标记）

zkw 利用端点自底向上累加祖先的懒标记，去掉了所有下推逻辑和递归调用，因而常数极小、代码量少。但它只能高效支持「可叠加」的懒标记，遇到区间赋值、区间最小/最大查询等更复杂的懒标记场景时，维护逻辑很快就会变得繁琐且易错。

经典递归线段树 功能最全，支持任意组合的懒标记和区间合并，扩展性强；唯一代价是模板较长、运行时有函数调用和下推开销。

树状数组 则针对点更新＋前缀/区间和查询做了极致优化，代码最简；但它天生不适合「赋值覆盖」「区间乘法」等复杂操作。

随着维护的问题越来越复杂，各类懒标记（赋值、乘法、异或、区间合并等）层出不穷，标记永久化方案的管理成本会迅速飙升，原本“少写几个函数”“去掉下推”的优势也将逐渐丧失。 所以其不能完全取代经典线段树。