list dict 性能测试

from random import randint

def load_list_data(total_nums, target_nums):

    """

    从文件中读取数据，以list的方式返回

    :param total_nums: 读取的数量

    :param target_nums: 需要查询的数据的数量

    """

    all_data = []

    target_data = []

    file_name = "fbobject_idnew.txt"

    with open(file_name, encoding="utf8", mode="r") as f_open:

        for count, line in enumerate(f_open):

            if count < total_nums:

                all_data.append(line)

            else:

                break

    for x in range(target_nums):

        random_index = randint(0, total_nums)

        if all_data[random_index] not in target_data:

            target_data.append(all_data[random_index])

            if len(target_data) == target_nums:

                break

    return all_data, target_data

def load_dict_data(total_nums, target_nums):

    """

    从文件中读取数据，以dict的方式返回

    :param total_nums: 读取的数量

    :param target_nums: 需要查询的数据的数量

    """

    all_data = {}

    target_data = []

    file_name = "fbobject_idnew.txt"

    with open(file_name, encoding="utf8", mode="r") as f_open:

        for count, line in enumerate(f_open):

            if count < total_nums:

                all_data[line] = 0

            else:

                break

    all_data_list = list(all_data)

    for x in range(target_nums):

        random_index = randint(0, total_nums-1)

        if all_data_list[random_index] not in target_data:

            target_data.append(all_data_list[random_index])

            if len(target_data) == target_nums:

                break

    return all_data, target_data

def find_test(all_data, target_data):

    #测试运行时间

    test_times = 100

    total_times = 0

    import time

    for i in range(test_times):

        find = 0

        start_time = time.time()

        for data in target_data:

            if data in all_data:

                find += 1

        last_time = time.time() - start_time

        total_times += last_time

    return total_times/test_times

if __name__ == "__main__":

    # all_data, target_data = load_list_data(10000, 1000)

    # all_data, target_data = load_list_data(100000, 1000)

    # all_data, target_data = load_list_data(1000000, 1000)

    # all_data, target_data = load_dict_data(10000, 1000)

    # all_data, target_data = load_dict_data(100000, 1000)

    # all_data, target_data = load_dict_data(1000000, 1000)

    all_data, target_data = load_dict_data(2000000, 1000)

    last_time = find_test(all_data, target_data)

    #dict查找的性能远远大于list

    #在list中随着list数据的增大 查找时间会增大

    #在dict中查找元素不会随着dict的增大而增大

    print(last_time)

不可变对象 都是可hash的， str， fronzenset， tuple，自己实现的类 __hash__

dict的内存花销大，但是查询速度快， 自定义的对象 或者python内部的对象都是用dict包装的

查找效率：set>dict>list

单次查询中：看来list 就是O(n)的；而set做了去重，本质应该一颗红黑树（猜测，STL就是红黑树），复杂度O(logn)；dict类似对key进行了hash,然后再对hash生成一个红黑树进行查找，其查找复杂其实是O(logn),并不是所谓的O(1)。O(1)只是理想的实现，实际上很多hash的实现是进行了离散化的。dict比set多了一步hash的过程，so 它比set慢，不过差别不大。

list dict 性能测试的更多相关文章

Locust性能测试学习总结
Locust学习总结分享简介: Locust是一个用于可扩展的,分布式的,性能测试的,开源的,用Python编写框架/工具,它非常容易使用,也非常好学.它的主要思想就是模拟一群用户将访问你的网站.每 ...
数据库之redis篇（2）—— redis配置文件，常用命令，性能测试工具
redis配置如果你是找网上的其他教程来完成以上操作的话,相信你见过有的启动命令是这样的: 启动命令带了这个参数:redis.windows.conf,由于我测试环境是windows平台,所以是这个 ...
性能测试URL自动转码
最近做性能测试,写了个python程序自动将URL里面的‘%2B’,‘20%’,‘3B'等转换成正常字符,方便查看. import os,sys; path = sys.path[0] os.chdi ...
Locust 性能测试工具安装使用说明
1. 介绍它是一个开源性能测试工具.使用 Python 代码来定义用户行为.用它可以模拟百万计的并发用户访问你的系统. 性能工具对比 LoadRunner 是非常有名的商业性能测试工具,功能 ...
【Python】模块学习之locust性能测试
背景 locust是一个python的第三方库,用于做性能测试,可使用多台机器同时对一台服务器进行压测,使用其中一台机器作为主节点,进行分布式管理博主测试接口的时候一直是使用python脚本,后来有 ...
[性能测试] locust学习-基础篇
在本文中,我将介绍一个名为Locust的性能测试工具.我将从Locust的功能特性出发,结合实例对Locust的使用方法进行介绍. 概述 Locust主要有以下的功能特性: 在Locust测试框架中, ...
Ignite性能测试以及对redis的对比
测试方法为了对Ignite做一个基本了解,做了一个性能测试,测试方法也比较简单主要是针对client模式,因为这种方法和使用redis的方式特别像.测试方法很简单主要是下面几点: 不作参数优化,默认 ...
性能测试工具 wrk 安装与使用
介绍今天给大家介绍一款开源的性能测试工具 wrk,简单易用,没有Load Runner那么复杂,他和 apache benchmark(ab)同属于性能测试工具,但是比 ab 功能更加强大,并且可以 ...
.NET Core性能测试组件BenchmarkDotNet 支持.NET Framework Mono
.NET Core 超强性能测试组件BenchmarkDotNet 支持Full .NET Framework, .NET Core (RTM), Mono. BenchmarkDotNet支持 C# ...

随机推荐

C# File和Directory类
File和Directory类作为实用类,File和Directory类都提供了许多方法,用于处理文件系统以及其中的文件和目录.这些是静态方法,涉及移动文件.查询和更新属性并创建FileStream ...
detection in video and image
video中的detection,背景更加复杂,目标更加不聚焦,同时由于图片分辨率低于图像,因此更加难做. image中的Detection,背景相对简单些,目标更加聚焦,同时图片分辨率高,因此更加容 ...
如何使用工具进行C/C++的内存泄漏检测
系统编程中一个重要的方面就是有效地处理与内存相关的问题.你的工作越接近系统,你就需要面对越多的内存问题.有时这些问题非常琐碎,而更多时候它会演变成一个调试内存问题的恶梦.所以,在实践中会用到很多工具来 ...
linux网络编程之断点传输文件
以下载链接"http://www.boa.org/boa-0.94.13.tar.gz"为例: 断点续传实验大概步骤: ===================== 1,使用geth ...
5.7 并行复制配置基于GTID 搭建中从基于GTID的备份与恢复，同步中断处理
5.7 并行复制配置基于GTID 搭建中从基于GTID的备份与恢复,同步中断处理这个文章包含三个部分 1:gtid的多线程复制2:同步中断处理3:GTID的备份与恢复下面文字相关的东西大部分 ...
【PHP】根据两地经纬度计算距离
最近做一个H5活动的项目,有个要求是必须现场玩家才能参与,所以就需要计算玩家位置和活动地点的距离来判断是否在活动现场. 以下是写的一个根据经纬度计算两地距离的方法 1 function getDist ...
16.VUE学习之-v-show的使用与v-if的差异对比
v-show的使用与v-if的差异对比相同点: 都可以达到隐藏和显示的效果. 不同点: v-show 会用display:none 来隐藏元素节点,推荐使用这种方式 v-if 会移除节点,可以配合v ...
Codeforces Round #461 (Div. 2) C. Cave Painting
C. Cave Painting time limit per test 1 second memory limit per test 256 megabytes Problem Descriptio ...
VS2010Datatable查看器查看超时(Microsoft.VisualStudio.DebuggerVisualizers)
这个问题由来已久,却一直没有找到原因.大家都知道,VisualStudio的DebuggerVisualizers是一个非常方便的插件,可以帮助我们调试时查看Datatable视图,前阵子突然发现在查 ...
cf984e Elevator
ref我好菜啊 #include <iostream> #include <cstring> #include <cstdio> #include <cmat ...

list dict 性能测试

list dict 性能测试的更多相关文章

随机推荐

热门专题