什么是离散化？C++实现方法

简介

离散化本质上可以看成是一种哈希，其保证数据在哈希以后仍然保持原来的全/偏序关系。

通俗地讲，就是当我们只关心数据的大小关系时，用排名代替原数据进行处理的一种预处理方法。离散化本质上是一种哈希，它在保持原序列大小关系的前提下把其映射成正整数。当原数据很大或含有负数、小数时，难以表示为数组下标，一些算法和数据结构（如BIT）无法运作，这时我们就可以考虑将其离散化。

用来离散化的可以是大整数、浮点数、字符串……等等。

实现

C++ 离散化有现成的 STL 算法：

离散化数组

将一个数组离散化，并进行查询是比较常用的应用场景：

// a[i] 为初始数组,下标范围为 [1, n]

// len 为离散化后数组的有效长度

std::sort(a + 1, a + 1 + n);

len = std::unique(a + 1, a + n + 1) - a -

      1;  // 离散化整个数组的同时求出离散化后本质不同数的个数。

在完成上述离散化之后可以使用 std::lower_bound 函数查找离散化之后的排名（即新编号）：

std::lower_bound(a + 1, a + len + 1, x) - a;  // 查询 x 离散化后对应的编号

同样地，我们也可以对 vector 进行离散化：

// std::vector<int> a, b; // b 是 a 的一个副本

std::sort(a.begin(), a.end());

a.erase(std::unique(a.begin(), a.end()), a.end());

for (int i = 0; i < n; ++i)

  b[i] = std::lower_bound(a.begin(), a.end(), b[i]) - a.begin();

实际演示：

现在我们有序列 A=[10, 23, 35, 3, -40, 3] 。我们先复制一个同样的序列：

int C[N];

memcpy(C, A, sizeof(A));

排序，去重：

sort(C, C + n);

int l = unique(C, C + n) - C; // l为不重复元素的数量

std::unique()的返回值是一个迭代器（对于数组来说就是指针了），它表示去重后容器中不重复序列的最后一个元素的下一个元素。所以可以这样作差求得不重复元素的数量。现在我们有C=[-40, 3, 10, 23, 35]。

再用一个数组，储存A中每个元素在C中的排名：

int L[MAXN];

for (int i = 0; i < n; ++i)

    L[i] = lower_bound(C, C + l, A[i]) - C + 1; // 二分查找

这样我们就实现了原序列的离散化。得到 L=[3, 4, 5, 2, 1, 2]。

因为排序和n次二分查找的复杂度都是 \(\mathcal{O}(n\ log\ n)\) ，所以离散化的复杂度也是 \(\mathcal{O}(n\ log\ n)\) 。完整代码很短：

int C[N], L[N];

// 在main函数中...

memcpy(C, A, sizeof(A)); // 复制

sort(C, C + n); // 排序

int l = unique(C, C + n) - C; // 去重

for (int i = 0; i < n; ++i)

    L[i] = lower_bound(C, C + l, A[i]) - C + 1; // 查找

离散化也不一定要从小到大排序，有时候也需要从大到小。这时在排序和查找时相应地加上greater<int>()就可以了。

什么是离散化？C++实现方法的更多相关文章

ACM/ICPC 之数据结构-线段树+区间离散化(POJ2528)
这道题用线段树做更方便更新和查询,但是其数据范围很大,因此要将离散化和线段树结合起来,算是一道比较经典的线段树+离散化的例题. 线段树的离散化有很多方法,在这里,我先用一次结点离散化,间接将源左右端点 ...
【POJ】2528 Mayor's posters ——离散化+线段树
Mayor's posters Time Limit: 1000MS Memory Limit: 65536K Description The citizens of Bytetown, A ...
数据预处理 | 使用 Pandas 进行数值型数据的标准化归一化离散化二值化
1 标准化 & 归一化导包和数据 import numpy as np from sklearn import preprocessing data = np.loadtxt('data.t ...
【转】用深度学习做crowd density estimation
本博文主要是CVPR2016的<Single-Image Crowd Counting via Multi-Column Convolutional Neural Network>这篇文章 ...
Codeforces 980D
这题其实挺水的,但我比较vegetable,交了好多次才过. 题意: 给定一个序列,把这个序列的所有连续子序列分组,每组中任意两个数相乘是个完全平方数,输出每个子序列最少分的组数: 思路: 先把每个数 ...
树状数组（BIT）—— 一篇就够了
树状数组(BIT)-- 一篇就够了前言.内容梗概本文旨在讲解: 树状数组的原理(起源,原理,模板代码与需要注意的一些知识点) 树状数组的优势,缺点,与比较(eg:线段树) 树状数组的经典例题及其技 ...
PID参数
大家奉上一篇关于PID算法及参数整定的知识! 1.位置表达式位置式表达式是指任一时刻PID控制器输出的调节量的表达式. PID控制的表达式为式中的y(t)为时刻t控制器输出的控制量,式中的y(0) ...
DS
树状数组原始问题 \(a_x \overset+\gets y\) \(\sum\limits_{i=1}^{r} a_i\) 解决方法: 定义 \({\rm lb}(i) = i-i \wedge ...
javaSE27天复习总结
JAVA学习总结 2 第一天 2 1:计算机概述(了解) 2 (1)计算机 2 (2)计算机硬件 2 (3)计算机软件 2 (4)软件开发(理解) 2 (5) ...
WOE:信用评分卡模型中的变量离散化方法（生存分析）
WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等. ...

随机推荐

再学Blazor——组件建造者
使用 RenderTreeBuilder 创建组件是 Blazor 的一种高级方案.前几篇文中有这样创建组件的示例 builder.Component<MyComponent>().Bui ...
【Java】Java中StringBuilder（）成员方法append（）和toString（）
StringBuilder就相当于C++的String长度可变,用于构造字符串对象,内部使用自动扩容的数组操作字符串数据. StringBuilder和StringBuffer使用的是相同的API[区 ...
介绍一个我开源的项目：一键部署 VictoriaMetrics 群集
作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯我实在是非常喜欢这个强大的 metrics 监控组件 Vi ...
VideoPipe可视化视频结构化框架更新总结（2023-12-5）
项目地址:https://github.com/sherlockchou86/video_pipe_c 往期文章:https://www.cnblogs.com/xiaozhi_5638/p/1696 ...
C++ Qt开发：PushButton按钮组件
Qt 是一个跨平台C++图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍QPushBu ...
[USACO2007OPEN S] Catch That Cow S
题目描述 FJ丢失了他的一头牛,他决定追回他的牛.已知FJ和牛在一条直线上,初始位置分别为x和y,假定牛在原地不动.FJ的行走方式很特别:他每一次可以前进一步.后退一步或者直接走到2*x的位置.计算他 ...
C++ Qt开发：ComboBox下拉组合框组件
Qt 是一个跨平台C++图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍ComboBo ...
CompletableFuture入门
CompletableFuture入门 1.Future vs CompletableFuture 1.1 准备工作先定义一个工具类 import java.nio.file.Files; impo ...
Python 提取 Word 文档中的文本和图片
将内容从 Word 文档中提取出来可以方便我们对其进行其他操作,如将内容储存在数据库中.将内容导入到其他程序中.用于 AI 训练以及制作其他文档等.第三方库 Spire.Doc for Python ...
MinIO客户端之head
MinIO提供了一个命令行程序mc用于协助用户完成日常的维护.管理类工作. 官方资料 mc head 查看对象的前N行内容,N默认为10,命令如下: ./mc head local1/bkt1/doc ...

什么是离散化？C++实现方法

简介

实现

离散化数组

什么是离散化？C++实现方法的更多相关文章

随机推荐

热门专题