Python开发【数据结构】：排序练习

排序练习

问题一：

现在有一个列表，列表中的数范围都在0到100之间，列表长度大约为100万。设计算法在O(n)时间复杂度内将列表进行排序。

import random

data = [random.randint(0,100) for x in range(10000)]

def count_sort(data):

    li = [0 for i in range(101)]

    for x in data:

        li[x] +=1

    count = 0

    for k,v in enumerate(li):

        for i in range(v):

            data[count]=k

            count +=1

count_sort(data)

问题二：

现在有n个数（n>10000），设计算法，按大小顺序得到前10大的数。应用场景：榜单TOP 10

1、插入排序：

import time

import random

def call_time(func):

    def inner(*args,**kwargs):

        t1 = time.time()

        re = func(*args,**kwargs)

        t2 = time.time()

        print('Time cost:',func.__name__,t2-t1)

        return re

    return inner

def insert(li, i):

    tmp = li[i]

    j = i - 1

    while j >= 0 and li[j] > tmp:

        li[j + 1] = li[j]

        j = j - 1

    li[j + 1] = tmp

def insert_sort(li):

    for i in range(1, len(li)):

        insert(li, i)

@call_time

def topk(li, k):　　　　#时间复杂度O(kn)

    top = li[0:k + 1]

    insert_sort(top)

    for i in range(k+1, len(li)):

        top[k] = li[i]

        insert(top, k)

    return top[:-1]

data = list(range(10000))

random.shuffle(data)

print(topk(data, 10))

# Time cost: topk 0.020502567291259766

# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

2、堆的方式：

取列表前10个元素建立一个小根堆。堆顶就是目前第10大的数。依次向后遍历原列表，对于列表中的元素，如果小于堆顶，则忽略该元素；如果大于堆顶，则将堆顶更换为该元素，并且对堆进行一次调整；遍历列表所有元素后，倒序弹出堆顶

import time

import random

def call_time(func):

    def inner(*args,**kwargs):

        t1 = time.time()

        re = func(*args,**kwargs)

        t2 = time.time()

        print('Time cost:',func.__name__,t2-t1)

        return re

    return inner

def sift(data, low, high):

    i = low

    j = 2 * i + 1

    tmp = data[i]

    while j <= high:    #孩子在堆里

        if j + 1 <= high and data[j] < data[j+1]:   #如果有右孩子且比左孩子大

            j += 1  #j指向右孩子

        if data[j] > tmp:   #孩子比最高领导大

            data[i] = data[j]   #孩子填到父亲的空位上

            i = j               #孩子成为新父亲

            j = 2 * i +1        #新孩子

        else:

            break

    data[i] = tmp           #最高领导放到父亲位置

@call_time

def topn(li, n):　　　　　　　　#时间复杂度O(nlogk)

    heap = li[0:n]

    # 构造包含n个元素列表的大栈堆

    for i in range(n // 2 - 1, -1, -1):

        sift(heap, i, n - 1)

    # 把列表中前n个小的数留到栈堆中

    for i in range(n, len(li)):

        if li[i] < heap[0]:

            heap[0] = li[i]

            sift(heap, 0, n - 1)

    # 把栈堆从小到大排列起来

    for i in range(n - 1, -1, -1):  # i指向堆的最后

        heap[0], heap[i] = heap[i], heap[0]  # 领导退休，刁民上位

        sift(heap, 0, i - 1)  # 调整出新领导

    return heap

data = list(range(10000))

random.shuffle(data)

print(topn(data, 10))

# Time cost: topn 0.0015001296997070312

# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

问题三：

给定一个列表和一个整数，设计算法找到两个数的下标，使得两个数之和为给定的整数

保证肯定仅有一个结果。例如，列表[1,2,5,4]与目标整数3，1+2=3，结果为(0, 1)

二分查找的思路：

def bin_search(data_set, val):

    low = 0

    high = len(data_set) - 1

    while low <= high:

        mid = (low+high)//2

        if data_set[mid] == val:

            left = mid

            right = mid

            while left >= 0 and data_set[left] == val:

                left -= 1

            while right < len(data_set) and data_set[right] == val:

                right += 1

            return (left + 1, right - 1)

        elif data_set[mid] < val:

            low = mid + 1

        else:

            high = mid - 1

    return

li = [1,2,3,3,3,4,4,5]

print(bin_search(li, 5))

# (7, 7)

问题四：

给定一个升序列表和一个整数，返回该整数在列表中的下标范围

例如：列表[1,2,3,3,3,4,4,5]，若查找3，则返回(2,4)；若查找1，则返回[0,0]

import copy

li = [1, 5, 4, 2]

target = 3

max_num = 100

def func1():

    for i in range(len(li)):

        for j in range(i+1, len(li)):

            if li[i] + li[j] == target:

                return (i,j)

def bin_search(data_set, val, low, high):

    while low <= high:

        mid = (low+high)//2

        if data_set[mid] == val:

            return mid

        elif data_set[mid] < val:

            low = mid + 1

        else:

            high = mid - 1

    return

def func2():

    li2 = copy.deepcopy(li)

    li2.sort()

    for i in range(len(li2)):

        a = i

        b = bin_search(li2, target - li2[a], i+1, len(li2)-1)

        if b:

            return (li.index(li2[a]),li.index(li2[b]))

def func3():			# O(n)复杂度

    a = [None for i in range(max_num+1)]

    for i in range(len(li)):

        a[li[i]] = i

        if a[target-li[i]] != None:

            return (a[li[i]], a[target-li[i]])

print(func3())

data_dict = {}

for i in range(len(data_list)):

    if data_list[i] in data_dict:

        print(data_dict[data_list[i]], i)

    else:

        data_dict[13 - data_list[i]] = i

Python开发【数据结构】：排序练习的更多相关文章

Python开发——数据结构【深浅拷贝】
浅拷贝 # 浅拷贝只copy一层 s = [3,'Lucy',4,[1,2]] s1 = s.copy() 深拷贝 # 深拷贝——克隆一分 import copy s = [3,'Lucy',4,[1 ...
Python开发——目录
Python基础 Python开发——解释器安装 Python开发——基础 Python开发——变量 Python开发——[选择]语句 Python开发——[循环]语句 Python开发——数据类型[ ...
Python开发【前端】：JavaScript
JavaScript入门 JavaScript一种直译式脚本语言,是一种动态类型.弱类型.基于原型的语言,内置支持类型.它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本 ...
Python 开发轻量级爬虫04
Python 开发轻量级爬虫 (imooc总结04--url管理器) 介绍抓取URL管理器 url管理器用来管理待抓取url集合和已抓取url集合. 这里有一个问题,遇到一个url,我们就抓取它的内容 ...
Python实现各种排序算法的代码示例总结
Python实现各种排序算法的代码示例总结作者:Donald Knuth 字体:[增加减小] 类型:转载时间:2015-12-11我要评论这篇文章主要介绍了Python实现各种排序算法的代码示 ...
python 与数据结构
在上面的文章中,我写了python中的一些特性,主要是简单为主,主要是因为一些其他复杂的东西可以通过简单的知识演变而来,比如装饰器还可以带参数,可以使用装饰类,在类中不同的方法中调用,不想写的太复杂, ...
[0x00 用Python讲解数据结构与算法] 概览
自从工作后就没什么时间更新博客了,最近抽空学了点Python,觉得Python真的是很强大呀.想来在大学中没有学好数据结构和算法,自己的意志力一直不够坚定,这次想好好看一本书,认真把基本的数据结构和算 ...
python开发学习-day01 (python安装与版本、字符串、字典、运算符、文件)
*:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !important; } /* ...
Python开发【第二十篇】：缓存
Python开发[第二十篇]:缓存redis&Memcache 点击这里 Python之路[第九篇]:Python操作 RabbitMQ.Redis.Memcache.SQLAlchemy ...
Eclipse和PyDev搭建python开发环境
Eclipse和PyDev搭建python开发环境 1.1整体目标本文档作为python学习者的新手教程,通过本教程能够了解python用途.语法.在实际工作中的应 ...

随机推荐

取石子（好学的C++）
巴什博奕(Bash Game)只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个.最后取光者得胜. 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少 ...
今天搞log4net插入错误日志去mysql数据库的时候出现了点问题，已解决。记录下解决方案
先上图配置log4net的时候要填这项,可是这个value我不知道啊.....上图里的value是我用下面的方法获取的 MySqlConnection con = new MySqlConnecti ...
linux命令详解之netstat
今天在使用linux的时候,要查看端口号,但是不知道要使用哪一个命令所以就学习了一下,原来是使用netstat,接下来给大家一起来学习. 一.netstat介绍 1.1.简介 Netstat 命令用于 ...
localhost 和 127.0.0.1
转自:http://ordinarysky.cn/?p=431localhost与127.0.0.1的区别是什么?相信有人会说是本地ip,曾有人说,用127.0.0.1比localhost好,可以减少 ...
深入理解bootstrap框架之第二章整体架构
标注下,正好最近关注前段框架 1. CSS-12栅格系统把网页宽度均分为12等分(保留15位精度)——这是bootstrap的核心功能. 2.基础布局组件包括排版.按钮.表格.布局.表单等等. 3 ...
Http post请求数据带中文参数问题
Http请求参数带中文参数时,如{"userName":"用户名123","password":"123456"} 请求 ...
linux下 redis 启动
启动文件 startredis.sh : nohup /data/redis/bin/redis-server /data/redis/etc/redis.conf & 关闭文件 stopr ...
阿里巴巴Java开发规约插件-体验
插件有哪些功能? 阿里技术公众号于今年的2月9日首次公布<阿里巴巴Java开发规约>,瞬间引起全民代码规范的热潮,上月底又发布了PDF的终极版,大家踊跃留言,期待配套的静态扫描工具开放出来 ...
HQL的执行过程
解释器.编译器.优化器完成HQL查询语句从词法分析.语法分析.编译.优化以及查询计划(Plan)的生成.生成的查询计划存储在HDFS中,并在随后有mapreduce调用执行. 举个例子: 第一步:输入 ...
oracle12c创建用户和表空间出现的问题
Oracle12c 中,增加了可插接数据库的概念,即PDB,允许一个数据库容器(CDB)承载多个可插拔数据库(PDB).CDB全称为 ContainerDatabase,中文翻译为数据库容器,PDB全 ...

Python开发【数据结构】：排序练习

排序练习

Python开发【数据结构】：排序练习的更多相关文章

随机推荐

热门专题