map和set的使用及top K问题

1.map和set的应用和比较

　　map和set都是关联式容器，底层容器都是红黑树。

　　map以键值对的形式进行存储，方便进行查找，关键词起到索引的作用，值则表示与索引相关联的数据，以红黑树的结构实现，插入删除等操作都可以在O(log n)时间内完成。

所有元素都是键+值存在，key=value组成pair，是一组映射关系。
不允许键重复
所有元素是通过键进行自动排序的
map的键是不能修改的，但是其键对应的值是可以修改的

 #include<string>

 #include<vector>

 //模拟pair和 make_pair的底层实现

 //template<class K, class V>

 //struct pair

 //{

 //    K first;

 //    V second;

 //

 //    pair(const K& key, const V& value)

 //        :first(key)

 //        , second(value)

 //    {}

 //};

 //template<class K, class V>

 //pair<K, V> make_pair(const K& key, const V& value)

 //{

 //    return pair<K, V>(key, value);

 //}

 //vector<string> GetTopKF(const vector<string>& fruits)

 //{

 //    vector<string> topk;

 //    typedef map<string, int> CountTop;

 //    typedef map<string, int>::iterator CountIt;

 //    CountTop counttop;

 //    for (size_t i = 0; i < fruits.size(); i++) {

 //        CountIt countit = counttop.find(fruits[i]);

 //        if (countit != counttop.end())

 //            (countit->second)++;

 //        else

 //            //counttop.insert(pair<string, int>(fruits[i], 1));

 //            counttop.insert(make_pair(fruits[i], 1));

 //    }

 //    return topk;

 //}

 vector<string> GetTopKF(const vector<string>& fruits)

 {

     vector<string> topk;

     typedef map<string, int> CountTop;

     typedef map<string, int>::iterator CountIt;

     CountTop counttop;

     for (size_t i = ; i < fruits.size(); i++) {

         /*pair<CountIt, bool> retKV = counttop.insert(make_pair(fruits[i], 1));

         if (retKV.second == false)

         {

         retKV.first->second++;

         }*/

         counttop[fruits[i]]++;

     }

     return topk;

 }

 void MapTest()

 {

     typedef map<string, string> Dict;

     typedef map<string, string>::iterator DictIt;

     Dict dict;

     dict.insert(pair<string, string>("right", "右边"));

     dict.insert(pair<string, string>("left", "左边"));

     dict.insert(pair<string, string>("世界", "你好"));

     dict.insert(pair<string, string>("hello", "word"));

     dict.insert(pair<string, string>("key", "键值"));

     DictIt dictit = dict.begin();

     while (dictit != dict.end()) {

         cout << (*dictit).first << " " << (*dictit).second << endl;

         ++dictit;

     }

     DictIt ret = dict.find("left");

     if(ret != dict.end())

         dict.erase(ret);

     vector<string> v;

     v.push_back("梨");

     v.push_back("苹果");

     v.push_back("西瓜");

     v.push_back("香蕉");

     v.push_back("西瓜");

     v.push_back("香蕉");

     v.push_back("菠萝");

     v.push_back("西瓜");

     v.push_back("草莓");

     GetTopKF(v);

 }

　　set支持高效的关键字查询操作---检查每一个给定的关键字是否在set中，也支持高效插入删除。

　　以平衡二叉检索树实现，查找使用中序遍历算法，检索效率高于vector，deque，list等容器，另外使用中序遍历可将键值按照从小到大遍历出来，构造set集合的主要目的是为了快速检索，不可直接去修改键值。

所得元素的只有key没有value，value就是key
不允许出现键值重复
所有的元素都会被自动排序
不能通过迭代器来改变set的值，因为set的值就是键

 #pragma once

 #include<iostream>

 #include<set>

 #include<map>

 using namespace std;

 void SetTest()

 {

     set<int> s1;  //没有数据冗余

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();

     s1.insert();  //set的插入操作

     set<int>::iterator ite = s1.begin();

     //ite = 10;

     while (ite != s1.end()) {  //利用迭代器遍历打印数据

         cout<<*ite<<" ";

         ite++;

     }

     cout << endl;

     set<int>::reverse_iterator ret1= s1.rbegin();

     while (ret1 != s1.rend()) { //降序打印

         cout << *ret1 << " ";

         ret1++;

     }

     set<int>::iterator ret = s1.find();  //

     if (ret != s1.end()) //set的查找，如果没有找到不会报错

         cout << "find it" << *ret << endl;

     else

         cout << "null" << endl;

     if (s1.count())//只判断是否存在14，返回1或0

         cout << "find it" << endl;

     else

         cout << "null" << endl;

     ret = s1.find(); //find后删除

     if (ret != s1.end())

         s1.erase(ret);

     set<int>::iterator last, first;

     first = s1.lower_bound(); //返回8大的第一个数

     last = s1.upper_bound(); //返回20大的第一个数

     s1.erase(first, last);//删除这个范围的数据

     s1.erase(); //有就删除，没有也不报错

     set<int>::iterator ite1 = s1.begin();

     while (ite1 != s1.end()) {

         cout << *ite1 << " ";

         ite1++;

     }

 }

 void MultisetTest() {

     multiset<int> s2; //允许数据冗余,其他操作同set

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     s2.insert();

     multiset<int>::iterator mit = s2.begin();

     while (mit != s2.end()) {

         cout << *mit << " ";

         mit++;

     }

     multiset<int>::iterator mIt = s2.find();

     /*++mIt;

     ++mIt;

     ++mIt;

     ++mIt;*/

  }

　　map的节点是一对数据，set的节点是一个数据。

2.扩展

　　Multimap允许数据冗余，即存储的数据不唯一。

　　hashmap是基于散列表（哈希表，hash table）实现的。基本原理是：使用一个下标范围比较大的数组来存储元素。可以设计一个函数（哈希函数，也叫做散列函数），使得每个元素的关键字都与一个函数值（即数组下标，hash值）相对应，于是用这个数组单元来存储这个元素；也可以简单的理解为，按照关键字为每一个元素“分类”，然后将这个元素存储在相应“类”所对应的地方，称为桶。

但不能够保证每个元素的关键字与函数值是一一对应的，有可能出现对于不同的元素，得到相同的函数值，这就是哈希冲突，往往需要专门的哈希冲突处理函数来解决。

　　hashma插入和查找的速度与哈希函数和冲突处理函数的实现有关，是这两个函数耗时的总和。查询时间复杂度是O(1)；

看具体的应用，不一定常数级别的hash_map一定比log(n)级别的map要好，hash_map的hash函数以及解决地址冲突等都要耗时间，而且众所周知hash表是以空间换时间的，因而hash_map的内存消耗肯定要大，一般情况下，如果记录非常大，考虑hash_map，查找效率会高很多，如果要考虑内存消耗，则要谨慎使用hash_map。

　　Multiset允许数据冗余。

map和set的使用及top K问题的更多相关文章

347. Top K Frequent Elements (sort map)
Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [ ...
347. Top K Frequent Elements
Given a non-empty array of integers, return the k most frequent elements. For example,Given [1,1,1,2 ...
[LeetCode] Top K Frequent Words 前K个高频词
Given a non-empty list of words, return the k most frequent elements. Your answer should be sorted b ...
海量数据处理 - 10亿个数中找出最大的10000个数（top K问题）
前两天面试3面学长问我的这个问题(想说TEG的3个面试学长都是好和蔼,希望能完成最后一面,各方面原因造成我无比想去鹅场的心已经按捺不住了),这个问题还是建立最小堆比较好一些. 先拿10000个数建堆, ...
如何解决海量数据的Top K问题
1．问题描述在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门 ...
[leetcode]692. Top K Frequent Words K个最常见单词
Given a non-empty list of words, return the k most frequent elements. Your answer should be sorted b ...
[leetcode]347. Top K Frequent Elements K个最常见元素
Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [ ...
top k问题
1.top k问题在海量数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最高的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题.例如,在搜索引擎中,统计搜索最 ...
【分步详解】两个有序数组中的中位数和Top K问题
(这也是一道leetcode的经典题目:<LeetCode>解题笔记:004. Median of Two Sorted Arrays[H] 问题介绍这是个超级超级经典的分治算法!!这个 ...

随机推荐

31、vue-cli3引入封装svg图标
svg图标放大不失真,png会出现失真现象. 一.方法一 1.在对应vue项目里添加插件 vue add svg-sprite 输入 Y 2.在执行 npm install svgo svgo-loa ...
深入理解SpringCloud之Gateway
虽然在服务网关有了zuul(在这里是zuul1),其本身还是基于servlet实现的,换言之还是同步阻塞方式的实现.就其本身来讲它的最根本弊端也是再此.而非阻塞带来的好处不言而喻,高效利用线程资源进而 ...
bugku 程序员本地网站
提示从本地访问,怎样让服务器认为你是从本地进行访问的: 使用burp抓包并在包中进行修改加入X-Forwarded-For: 127.0.0.1 X-Forwarded-For: 简称XFF头,它代表 ...
wamp server mysql数据库中事件不执行的解决办法
先看看看event 事件是否开启直接执行下列语句即可, show variables like '%sche%'; 如没开启,则开启. (需要数据库超级权限) set global event_sc ...
渗透-svn源代码泄露漏洞综合利用
SVN是Subversion的简称,是一个开放源代码的版本控制系统,相较于RCS.CVS,它采用了分支管理系统,它的设计目标就是取代CVS.互联网上很多版本控制服务已从CVS迁移到Subversion ...
ArrayList源码解析[一]
ArrayList源码解析[一] 欢迎转载,转载烦请注明出处,谢谢. https://www.cnblogs.com/sx-wuyj/p/11177257.html 在工作中集合list集合用的相对来 ...
概念理解：boost::asio::io_service
IO模型 io_service对象是asio框架中的调度器,所有异步io事件都是通过它来分发处理的(io对象的构造函数中都需要传入一个io_service对象). asio::io_service i ...
百万年薪python之路 -- 递归
递归(每当有一个函数被递归调用,就应该要有一个返回值,才能正常把递归的返回值'归'回来) 一个正经的递归: 1.不断调用自己本身 2.有明确的结束条件递归注重于"一递一归&quo ...
轻量级CNN模型mobilenet v1
mobilenet v1 论文解读论文地址:https://arxiv.org/abs/1704.04861 核心思想就是通过depthwise conv替代普通conv. 有关depthwise ...
OptimalSolution(4)--字符串问题（1）简单
一.判断两个字符串是否互为变形词问题:给定两个字符串str1和str2,如果str1和str2中出现的字符种类一样且每种字符出现的次数也一样,那么str1与str2互为变形词. 举例:str1=“1 ...

map和set的使用及top K问题

map和set的使用及top K问题的更多相关文章

随机推荐

热门专题