[转]std::set、自定义类型与比较函数

转自:http://www.189works.com/article-42025-1.html

怎样在set中放入自定义类型？这个问题通过谷歌就可以得到不少答案：1、定义一个函数对象并在定义set的时候将其作为第二个模板参数。2、为自定义类型定义<运算符。如：

class Edge

{

public:

Edge(int u, int v): u(u), v(v){}

bool operator < (const Edge& edge) const

{

    return this->u < edge.u;

}    //为了方便起见设为public    int u;      int v;

};

class EdgeComp

{

public:

bool operator()(const Edge& left, const Edge& right)

{

    return left.u < right.u;

}

};

std::set<Edge> edge_set;

Edge edge_a(0, 1);

Edge edge_b(0, 2);

edge_set.insert(edge_a);

edge_set.insert(edge_b);

std::set<Edge, EdgeComp> edge_set2;

edge_set2.insert(edge_a);

edge_set2.insert(edge_b);

其实两种方法的道理是一样的，就是set需要一个比较函数对象comp。set的第二个模板参数默认为less函数对象，它会调用自定义类型的<运算符。那么，为什么需要这个比较对象呢。让我们看看标准中对关联容器的规定：two keys k1 and k2 are considered to be equivalent if for the comparison object comp, comp(k1, k2) == false && comp(k2, k1) == false.

原来set需要这个comp函数对象来判断元素的唯一性，通过两次参数顺序不同的调用来确定。但是是不是自定义的比较函数仅仅满足这个条件就够了呢？我们先来看看下面这个来自stackoverflow的问题；对于Edge类，为了将(1,2)、(2,1)视为同样的对象（可以想象Edge表示一条直线上的线段，那么这两个对象其实表达的是同一条线段），提问者定义了如下<运算符：

bool operator< (const Edge& e) const

{

    bool result = true;

    if( (u == e.u && v == e.v)||(v == e.u && u == e.v) )

    {

        result = false;

    }

    return result;

}

对(1,2)、(2,1)两个Edge对象，该运算符当然满足k1 < k2==false && k2 < k1==false。这完全符合Effective STL的第21条（的标题）：总是让比较函数在等值情况下返回false。按理说应该可以正确的保证set中元素的唯一性。但是结果向set插入(1,2) -> (1,2) -> (2,1) -> (3,2) -> (2,3) -> (5,2)-> (1,2)后， set中却保存了如下元素：(1,2), (3,2), (5,2), (1,2)。

这是为什么呢？原来标准中对对关联容器还有另一个规定：

Effective STL的第21条内部也提到了（看来读书不能只做标题党啊），“从技术上来说，用于对关联容器排序的比较函数必须为它们所比较的对象定义一个‘严格的弱序化’(strick weak ordering)”。什么是严格的弱序化？让我们看看wiki上的定义：Each associative container is parameterized on Key and an ordering relation Compare that induces a strict weak ordering on elements of Key.

其实Effective STL的第21条内部也提到了（看来读书不能只做标题党啊），“从技术上来说，用于对关联容器排序的比较函数必须为它们所比较的对象定义一个‘严格的弱序化’(strick weak ordering)”。什么是严格的弱序化？让我们看看wiki上的定义：严格弱序化拥有如下属性:对于集合S中所有的x，y，z，对于所有的x，不存在x < x （非自反性 - 21条标题说的就是这个）;对于所有x不等于y，如果x < y那么不存在y < x （不对称性）;对于所有的x，y和z，如果x < y并且y < z，那么x < z（传递性）;如果x < y，那么对于所有的z，要么x < z要么z < y（或者两者都成立）.

显然，上例中的<运算符违反了不对称性，只要x，y不相等，x < y和 y < x都会返回true。下面让我们再来分析一下为什么这个违规会造成多余节点的插入。由于标准对关联容器的一些约束，如在关联容器中查找一个元素需要在对数时间内完成，基本上所有关联容器的底层都会用二叉搜索树类的数据结构来实现。这里就用平衡二叉搜索树作为例子，虽然实际的实现一般是更特殊的红黑树，但是不影响分析。另外值得注意的是，违反了标准属于未定义行为，所以下面的分析只是一种可能性。我们知道，一个二叉搜索树的节点放置规则是：任何节点的键值一定大于其左子树中任一节点的键值，并小于其右子数中任一节点的键值。因此我们可以模拟出插入过程，注意所有不相等的数对都回返回true，即永远只会与左子树中的节点比较：

插入(1,2)：（1,2）

插入(1,2)：与(1,2)比较判定为已存在，不插入

插入(2,1)：与(1,2)比较判定为已存在，不插入

插入(3,2)：

(1,2）

(3,2)

插入(2,3)：与(1,2)比较返回true，然后与(3,2)比较，判定为已存在，不插入

插入(5,2)：与(1,2)比较返回true，然后与(3,2)比较返回true，插入。之后对树进行了重新平衡

(3,2)

/ \

(5,2) (1,2)

插入(1,2)：与(3,2)比较返回true，与(5,2)比较返回true，插入

(3,2)

/ \

(5,2) (1,2)

(1,2)

至此，(1,2)再次被插入了树中。由上面的分析可以看出，如果某C++的实现选择普通的二叉搜索树作为底层数据结构，数据将会退化为一条链表，此时反而是可以防止(1,2)再次被插入的。但是基于性能考虑，相信没有C++实现会这样做。（这里扯个个题外话，VC的set底层实现在debug版本时会对不对称性进行检查，如果违反会抛出一个异常。因此对于debug版有问题，release版没问题的程序也不能掉以轻心啊）

现在我们可以给文章一开始提到的方法添加一个补充约束：总是让比较函数使被比较对象满足严格的弱序。

[转]std::set、自定义类型与比较函数的更多相关文章

std::map自定义类型key
故事背景:最近的需求需要把一个结构体struct作为map的key,时间time作为value,定义:std::map<struct, time> _mapTest; 技术调研:众所周知, ...
c/c++ 标准库 set 自定义关键字类型与比较函数
标准库 set 自定义关键字类型与比较函数问题:哪些类型可以作为标准库set的关键字类型呢??? 答案: 1,任意类型,但是需要额外提供能够比较这种类型的比较函数. 2,这种类型实现了 < 操 ...
在set中放入自定义类型
这件事情的起因是在学习背包问题时突然想到了一种算法,分析了一下应该是n^2logn复杂度的,当然比dp慢.但是既然想到了就实现了下: #include<bits/stdc++.h> usi ...
关于set或map的key使用自定义类型的问题
我们都知道set或map的key使用自定义类型时必须重载<关系运算符但是,还有一个条件,所调用重载的小于操作符,使用的对象必须是const 而对象调用的方法也必须是const的 1 #incl ...
map以自定义类型当Key
关于map的定义: template < class Key, class T, class Compare = less<Key>, class Allocator = alloc ...
QSet使用及Qt自定义类型使用QHash等算法
版权声明:若无来源注明,Techie亮博客文章均为原创. 转载请以链接形式标明本文标题和地址: 本文标题:QSet使用及Qt自定义类型使用QHash等算法本文地址:http://techie ...
C++类型转换 -- 由其他类型转换到自定义类型
由其他类型转换到自定义类型由其他类型(如int,double)向自定义类的转换是由构造函数来实现,只有当类的定义和实现中提供了合适的构造函数,转换才能通过. /******************* ...
Qt自定义类型使用QHash等算法（Qt已经自定义了34种类型，包括int, QString, QDate等基本数据类型）
自定义类型 #include <QCoreApplication> #include <QSet> #include <QDebug> class testCust ...
《精通C#》自定义类型转化-扩展方法-匿名类型-指针类型（11.3-11.6）
1.类型转化在C#中有很多,常用的是int类型转string等,这些都有微软给我们定义好的,我们需要的时候直接调用就是了,这是值类型中的转化,有时候我们还会需要类类型(包括结构struct)的转化,还 ...

随机推荐

半夜思考之查漏补缺 , Spring 中 Bean 之间的依赖问题
每次看书都会发现自己的不足 . 当一个 singten 的 Bean 依赖一个 prototype 的 Bean 时 , 如果不加注意 , 会发生一些奇怪的事情 , prototype 变为了 sin ...
MachineLearning Exercise 7 ： K-means Clustering and Principle Component Analysis
findClosestCentroids.m m = size(X,); :m [value index] = min(sum((repmat(X(i,:),K,)-centroids).^,)); ...
DAY4-Flask项目
项目出现的问题: 问题处在import requests.requests库已经安装了啊; 找了半天也不知道具体错误在哪里,根据提示想是不是http.py这个模块与Python内置的同名模块冲突了?所 ...
DPM(Deformable Parts Model)
DPM(Deformable Parts Model) Reference: Object detection with discriminatively trained partbased mode ...
sqlmap利用DNS进行oob(out of band)注入（转）
0x00 起因实际案子的时候遇到了一个注入,过狗可以使用sqlmap,但是是基于时间的注入和限制频率需要使用--delay参数,本来就是延时再加上--delay等的心力憔悴.所有有了下面介绍使用 ...
【bzoj3881】【Coci2015】Divljak
题解对$S$集合ac建自动机,把$T_{i}$放在里面跑,记录路径上的所有节点并对它们在fail树上求到root的树链并: 这样就得到了$T_{i}$所有的子串: 动态将$T_{i}$加入直接用树状 ...
linux kill 掉所有匹配到名字的进程
如,要 kill 掉 swoole 相关的进程 ps aux | grep swoole | awk '{print $2}' | xargs kill -9 ps 列出所有进程, 参数: a - ...
Spss22安装与破解步骤
Spss22安装与破解教程向师姐请教了一些学术问题,哈哈说的有点大,不过真的很感谢,学到了很多,少走了很多弯路. 1.下载安装包可以去IBM官网.人大论坛等网站下载,全部文件应包括spss22安装 ...
linux（ubuntu） mysql安装使用
简单的安装一下: sudo apt-get install mysql-server apt-get isntall mysql-client sudo apt-get install libmysq ...
(转) 经典功率谱估计及Matlab仿真
原文出自:http://www.cnblogs.com/jacklu/p/5140913.html 功率谱估计在分析平稳各态遍历随机信号频率成分领域被广泛使用,并且已被成功应用到雷达信号处理.故障诊断 ...

[转]std::set、自定义类型与比较函数

[转]std::set、自定义类型与比较函数的更多相关文章

随机推荐

热门专题