c++离散化处理大范围和重复数据

关于离散化

　　有些新手可能会问：离散化是什么？离散化就是将无限空间中有限的个体映射到有限的空间里去。

　　上面的定义肯定会有人看不懂（其实我刚开始学的时候也看不懂）

　　用我自己的话来说，就是在不改变数据的相对大小的条件下，对数据进行相应的压缩

　　可能还是有人看不懂，没关系，我们来看一个例子，顺便来讲一下离散化的基本操作：

　　现有一个数组：1，100，2367，562，364737，19，1974832947，100，562，2367

　　如果按照正常的方法，该开1974832947的空间，但是经过离散化后，就不需要

　　那么step 1：排序

　　用上面的例子来说，就是将上面的数据排序并去重，得到下面这组数据：

　　1，19，100，100，562，562，2367，2367，364737，1974832947

　　然后step 2：通过unique去重使大小与下标对应，并得到去重后的长度，得到下面这组数据：

　　1，19，100，562，2367，364737，1974832947

　　接着step 3：通过lower_bound算出离散化后的排列，得到下面这组数据：

　　1，2，3，4，5，6，7

　　那么这里就很尴尬了，这组数据无法应用于初始数据

　　所以在开始，我们多定义1个数组，来记录初始情况下的数据，再用step 3与其进行对应。

　　最终得到答案：1，3，5，4，6，2，7，3，4，5

　　下面给出模板：

 #include<bits/stdc++.h>

 using namespace std;

 int a[],b[],n;

 int main()

 {

     ios::sync_with_stdio(false);

     cin.tie();

     cin>>n;

     for(int i=;i<=n;i++)

     {

         cin>>a[i];

         b[i]=a[i];

     }

     sort(a+,a+n+);

     int len=unique(a+,a+n+)-a-;

     for(int i=;i<=n;i++)

         b[i]=lower_bound(a+,a+len+,b[i])-a;

     for(int i=;i<=n;i++) cout<<b[i]<<" ";

     return ;

 }

c++离散化处理大范围和重复数据的更多相关文章

sql： having使用，及删除重复数据
写了好几年的sql,having语句基本上很少写,这就有一点尴尬了,现在总结一下having的作用,每日整理一下学习文档. having 通常伴随group by使用,过滤group by的数据集. ...
查询和删除表中重复数据sql语句
1.查询表中重复数据.select * from peoplewhere peopleId in (select peopleId from people group by ...
MSSQL如何在没有主键的表中删除重复数据
为了对重复数据进行实验,下面建一个设计不太好(没有主键)表并插入了一些重复数据: create database testdb use testdb ; go create table DupsNoP ...
Windows Server 2012重复数据删除技术体验
在企业环境中,对磁盘空间的需求是惊人的.数据备份.文件服务器.软件镜像.虚拟磁盘等都需要占据大量的空间.对此,微软在Windows Server 2012中引入了重复数据删除技术.重复数据删除技术通过 ...
Oracle查询表里的重复数据方法：
一.背景一张person表,有id和name的两个字段,id是唯一的不允许重复,id相同则认为是重复的记录. 二.解决 select id from group by id having count ...
mysql查询表里的重复数据方法：
INSERT INTO hk_test(username, passwd) VALUES ('qmf1', 'qmf1'),('qmf2', 'qmf11') delete from hk_test ...
用excel处理重复数据
我们在处理数据时,重复数据常常会对分析造成很大麻烦,因此数据整理初期一个重要的工作是排重,excel2007以上版本中有一个删除重复项功常便捷,但是每次点来点去也很麻烦,下面我们用公式来对一些重复数据 ...
oracle学习----去除表中的重复数据
重复的数据可能有这样两种情况,第一种:表中只有某些字段一样,第二种:两行记录完全一样.第一.对于部分字段重复数据的删除先来谈谈如何查询重复的数据吧. 下面语句可以查询出那 ...
Android开发之适配器-ListView适配器的重复数据
适配器是Android中的数据与View视图的桥梁,作用就是将数据通过适配器显示到对应的View视图上. 工作中,在用ListView做适配器数据时候,有些人肯定碰见过,如何优化效率,但是又出现重复数 ...

随机推荐

pytorch GPU训练好的模型使用CPU加载
torch.load('tensors.pt') # 把所有的张量加载到CPU中 torch.load('tensors.pt', map_location=lambda storage, loc: ...
新建MapReduce项目
添加各种jar包 /usr/local/hadoop/share/hadoop/.. 这几个文件夹下的jar包以及它们子目录lib下的所有jar包将/usr/local/hadoop/etc/had ...
sql注入 pikachu
闭合条件的探测数字型注入 burp抓包分别测试 id=1 and 1=1和id=1 or 1=1 存在漏洞字符型注入 ' 报错探测闭合条件 ' order by 1# 未报错.构成闭合同上有 ...
swoole学习--登录模块
使用swoole+thinkphp6.0+redis 结合开发的登录模块,做完之后有几点感悟: 1.不要相信任务数据,包括请求的外部接口,特别是超时者部分,尽可能的交给task完成. 2.原来可以在入 ...
memcache雪崩
缓存雪崩一般是由某个缓存节点失效,导致其他节点的缓存命中率下降, 缓存中缺失的数据(memcache经典场景,当有一个客户端的服务请求过来的时候,首先去查memcache,memcache里面是否缓存 ...
[Windows] 如何用编程的方式格式化硬盘
If memory serves, you're looking for SHFormatDrive(). Use the Format method of the Win32_Volume clas ...
C# 9 新特性：代码生成器、编译时反射
前言今天 .NET 官方博客宣布 C# 9 Source Generators 第一个预览版发布,这是一个用户已经喊了快 5 年特性,今天终于发布了. 简介 Source Generators 顾名 ...
hdu_2570 迷障贪心
迷瘴 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submissi ...
（数据科学学习手札82）基于geopandas的空间数据分析——geoplot篇(上)
本文示例代码和数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在前面的基于geopandas的空间数据分 ...
为物联网而生：高性能时间序列数据库HiTSDB商业化首发！
为什么80%的码农都做不了架构师?>>> 摘要: 近日,阿里云宣布高性能时间序列数据库 (High-Performance Time Series Database , 简称 H ...

c++离散化处理大范围和重复数据

c++离散化处理大范围和重复数据的更多相关文章

随机推荐

热门专题