用STL编敲代码时常常使用vector容器来存储数据。当容器中的数据有序时我们能够採取两种方式:

(1) 利用<algorithm>中的find函数进行查找;

(2) 折半查找。

另外也能够将数据存入hash_map中进行查找,以下来測试比較这两种方法的时间效率。

1. 測试数据集

生成比99999小的全部素数作为查询数据集,查找2到99999之间的全部数。

令数组A存储2~99999之间的全部数。则生成素数的方式

(1) 找到当前最小的数字min;

(2) 然后删除min的全部倍数。

反复这两个过程直到A中全部的数字处理完成,即找到了2~99999之间的全部素数。

2. 效率比較

利用find函数查找须要2745ms,利用折半与hash_map均仅仅须要0ms。

当数字添加到999999时,折半耗时63ms,hash_map耗时31ms。

当数字添加到9999999时,折半耗时577ms,hash_map耗时499ms。

注:hash_map中无法初始化桶的个数会减少hash的速度。

(欢迎大家告知怎样初始化)

3. 分析

实际遇到的问题:在处理大规模图数据的过程中遇到了vector能存储全然部的图数据,而hash_map却不能。即vector存储的数据规模比hash_map大。

折半查找仅仅能用于有序的数据的查找,而find无要求。

4. 參考代码

#include <string>
#include <sstream>
#include <time.h>
#include <algorithm>
#include <vector>
#include <iostream>
#include <hash_map>
using namespace std; class compare
{
vector<int> dataVector;
vector<int> findData;
hash_map<int, int> dataHash;
public:
compare();
~compare(void);
void generalPrime();
void findTest();
void binSearch();
void hashTest();
}; compare::compare()
{
generalPrime();
} compare::~compare(void)
{
findData.clear();
dataVector.clear();
} void compare::findTest()
{
clock_t startTime = clock();
vector<int>::iterator result;
int exist = 0;
for (vector<int>::iterator it = findData.begin(); it < findData.end(); it++)
{
result = find(dataVector.begin(), dataVector.end(), *it);
if (result != dataVector.end())
{
//查找成功
exist++;
}
}
clock_t endTime = clock();
cout << "exist num: " << exist << " find time " << (double)(endTime - startTime)/CLOCKS_PER_SEC*1000 << "ms" <<endl;
} void compare::binSearch()
{
int start;
int end;
int middle;
int exist = 0;
clock_t startTime = clock();
for (vector<int>::iterator it = findData.begin(); it < findData.end(); it++)
{
start = 0;
end = dataVector.size() - 1;
middle = (start + end) / 2;
while (start <= end)
{
if (*it < dataVector[middle])
{
end = middle - 1;
}
else if (*it > dataVector[middle])
{
start = middle + 1;
}
else
{
break;
}
middle = (start + end) / 2;
}
if (start <= end)
{
exist++;
}
}
clock_t endTime = clock();
cout << "exist num: " << exist << " binsearch time: " << (double)(endTime - startTime)/CLOCKS_PER_SEC * 1000 << "ms" << endl;
} void compare::generalPrime()
{
int maxPrime = 99999;
int flag;
vector<bool> visited(maxPrime, true);
for (int i = 2; i < maxPrime; ++i)
{
findData.push_back(i);
if (visited[i])
{
dataVector.push_back(i);
dataHash[i] = 1;
flag = i;
for (int ii = 2, flag = i * ii; flag < maxPrime; ++ii, flag *= ii)
{
visited[flag] = false;
}
}
}
} void compare::hashTest()
{
clock_t startTime = clock();
int exist = 0;
vector<int>::iterator result;
for (vector<int>::iterator it = findData.begin(); it < findData.end(); it++)
{
if (dataHash.find(*it) != dataHash.end())
{
exist++;
}
}
clock_t endTime = clock();
cout << "exist num: " << exist << " hash time " << (double)(endTime - startTime)/CLOCKS_PER_SEC*1000 << "ms" << endl;
}
int main()
{
compare com;
com.findTest();
com.binSearch();
com.hashTest();
return 1;
}

vector数据查找方法的更多相关文章

  1. Oracle索引梳理系列(一)- Oracle访问数据的方法

    版权声明:本文发布于http://www.cnblogs.com/yumiko/,版权由Yumiko_sunny所有,欢迎转载.转载时,请在文章明显位置注明原文链接.若在未经作者同意的情况下,将本文内 ...

  2. STM32 使用 printf 发送数据配置方法 -- 串口 UART, JTAG SWO, JLINK RTT

    STM32串口通信中使用printf发送数据配置方法(开发环境 Keil RVMDK) http://home.eeworld.com.cn/my/space-uid-338727-blogid-47 ...

  3. sap 三代出口(BADI)的查找方法

    sap 三代出口(BADI)的查找方法 对于根据事务代码查找对应的BADI,网上介绍的方法很多,但总结下来无非就两种方法,在此把它记录下来,方便以后自己查阅了.(1)通过SE24,输入CL_EXITH ...

  4. 恢复oracle数据库误删除数据的方法汇总

    学习数据库时,我们只是以学习的态度,考虑如何使用数据库命令语句,并未想过工作中,如果误操作一下,都可能导致无可挽回的损失.当我在工作中真正遇到这些问题时,我开始寻找答案.今天主要以oracle数据库为 ...

  5. 最全的iOS数据存储方法

    目的 项目准备运用的Core Data进行本地数据存储,本来打算只写一下Core Data的,不过既然说到了数据存储,干脆来个数据存储基础大总结!本文将对以下几个模块进行叙述. 沙盒 Plist Pr ...

  6. MongoDB学习(查找文档和其他数据查找操作)

    理解Cursor对象和查询运算符 cursor对象 cursor对象相当于一个指针,可通过迭代它来访问MongdoDB数据库中的一组对象. 在使用 find() 方法查询时,返回的并非实际文档,而是一 ...

  7. pytorch:EDSR 生成训练数据的方法

    Pytorch:EDSR 生成训练数据的方法 引言 Winter is coming 正文 pytorch提供的DataLoader 是用来包装你的数据的工具. 所以你要将自己的 (numpy arr ...

  8. Java集合系列(二):ArrayList、LinkedList、Vector的使用方法及区别

    本篇博客主要讲解List接口的三个实现类ArrayList.LinkedList.Vector的使用方法以及三者之间的区别. 1. ArrayList使用 ArrayList是List接口最常用的实现 ...

  9. C#调试程序——断点+几种观察数据的方法

    目录 C#调试程序--断点+观察数据的方法 1.写本文的背景 2.调试与测试 3.断点调试 3.1 F10 3.2 F11 3.3 SHIFT+F11 4.监视 4.1 按照1方法打断点,单步调试. ...

随机推荐

  1. Eclipse+EGit的配置注意点, 以及解决Github多个本地仓库之间的冲突

    问题描述 不同本地仓库(e.g. Repo1, Repo2)之间同时修改一个文件时, 出现文件无法merge的情况. 具体表现为, 冲突(红色双向实心箭头)一直存在, 点pull没反应, 点push报 ...

  2. codeforces 632D. Longest Subsequence 筛法

    题目链接 记录小于等于m的数出现的次数, 然后从后往前筛, 具体看代码. #include <iostream> #include <vector> #include < ...

  3. Word2Vec在Tensorflow上的版本以及与Gensim之间的运行对比

    接昨天的博客,这篇随笔将会对本人运行Word2Vec算法时在Gensim以及Tensorflow的不同版本下的运行结果对比.在运行中,参数的调节以及迭代的决定本人并没有很好的经验,所以希望在展出运行的 ...

  4. JS严格模式和非严格模式的区别

    严格模式和非严格模式的区别 //f1.js 'use strice'; //整个js文件都是严格模式下执行的 var n = 1; var foo = function(){...}; //... v ...

  5. MD5的加密和解密(总结)

    效果图例如以下: package com.test; import java.security.MessageDigest; public class MD5 { // MD5加码.32位 publi ...

  6. The Building Blocks-Components of EA part 1- Information and Strategy

    1. Zachman Framework Presented as matrix of Rows and Columns representing domain of interest and lev ...

  7. Head First设计模式学习笔记

    最近在学C++,直接语法之后觉得不太有意思,直接做项目又觉得太肤浅.正好之前一直想学设计模式来着,可惜之前一直在玩C,所以没有机会深入学习,于是决定用C++把设计写一遍.看了点GOF的<设计模式 ...

  8. Nhibernate初入门基本配置(二)

    转载地址http://www.cnblogs.com/kissdodog/p/3306428.html 使用NHibernate最重要的一步就是配置,如果连NHibernate都还没有跑的起来,谈何学 ...

  9. BootStrap 智能表单系列 十一 级联下拉的支持

    像省市县选择的这种,但凡是个人肯定都见过,实现方式有很多种 1.有在第一级选择的时候去加载或者从本地对象中拿第一级对应的数据源显示到列表中,第二级以此类推 2.也有将所有的项都加载到select中,然 ...

  10. Jquery ajax调用后台aspx后台文件方法(不是ashx)

    在asp.net webForm开发中,用Jquery ajax调用aspx页面的方法常用的有两种:下面我来简单介绍一下. (1)通过aspx.cs的静态方法+WebMethod进行处理 简单的介绍下 ...