Python 第八阶段学习记录之---算法

算法(Algorithm): 一个计算过程， 解决问题的方法

1、递归的两个特点
    - 调用自身
    - 结束条件

时间复杂度
    - 时间复杂度是用来估计算法运行时间的一个式子（单位）
    - 一般来说，时间复杂度高的算法比复杂度低的算法快
空间复杂度
    用来评估算法内存占用大小的一个式子

列表查找： 从列表中查找指定元素
    输入：无序
    输出：有序
顺序查找：
    从列表第一个元素开始，顺序进行搜索，直到找到为止。

二分查找：
    从有序列表的候选区data[0:n]开始，通过对待查找的值与候选区中间值的比较，可以使候选区减少一半。
    找任何一个数，次数都不会超过LOG 2 N,  2为底N的对数， 2 ** x <= n
    在10**5内找一个数，那么找到它，需要找的次数 2 **x < 10**5, x = 16

列表排序：

    列表排序： 将无序列表变为有序列表
    应用场景：
        各种榜单、表格、给二分排序用，给其它算法用

    排序lowB三人组：
        冒泡排序
        选择排序
        插入排序
    快速排序
    排序NB二人组：
        - 堆排序
        - 归并排序
    没什么人用的排序：
        基数排序
        希尔排序
        桶排序

一、LOW
    时间复杂度：O(n**2)
    空间复杂度：O(1)

    冒泡排序：
        时间复杂度：O(n**2)
        random.shuffle(data) #
        排序一万个数得10多秒，
        首先，列表每两个相邻的数，如果前边的比后边的大，那么交换这两个数
        如果冒泡排序中执行一趟而没有交换，则列表已经是有序状态，可以直接结束算法。
    选择排序
        一趟遍历记录最小的数，放到第一个位置；
        再一趟遍历记录剩余列表中最小的数，继续放置；
        找到最小的数:
            if xx < xxx: xxx=xx, xx,xx=xx,xx, 小于则交换
    插入排序：(打牌一样，来一个数、插入一次)
        列表被分为有序区和无序区两个部份。最初有序区只有一个元素。
        每次从无序区选择一个元素，插入到有序区的位置，直到无序区变空。

二、快排（快速排序）
    快速排序：
        好写的排序算法里最快的
        快的排序里最好写的

    快排思路：
        取一个元素P(第一个元素), 使P归位；
        列表被P分成两部分，左边都比P小，右边都比P大；
        递归完成排序

    效率：
        快排相比冒泡快了多少？
    问题：
        最坏情况
        递归

        最好情况    一般情况    最坏情况
快排    O(nlogn)    O(nlogn)    O(n^2)
冒泡    O(n)        O(n^2)       O(n^2)

    代码实现：

堆
    树是一种数据结构          比如：目录结构
    树是一种可以递归定义的数据结构
    树是由n个节点组成的集合：
    如果n=0，那这是一棵空树；
    如果n>0，那存在1个节点作为树的根节点，其他节点可以分为m个集合，每个集合本身又是一棵树。
    一些概念
        根节点、叶子节点
        树的深度（高度）
        树的度： 有几个子结点(下一层，)
        孩子节点/父节点
        子树

    二叉树：度不超过2的树（节点最多有两个叉）
        满二叉树
        完全二叉树

    二叉树的存储方式：
        链式存储方式
        顺序存储方式（列表）

        父节点和左孩子节点的编号下标有什么关系？
            i -> 2*i + 1

        父节点和右孩子节点的编号下标有什么关系？
            i -> 2i+2
        比如，我们要找根节点左孩子的左孩子
            x = 2*(2*0+1)+1 = 3， list_[3]
        最后一个有子结点的堆
            x = n // 2 - 1 # n = len()

    二叉树是度不超过2的树
    满二叉树与完全二叉树
    （完全）二叉树可以用列表来存储，通过规律可以从父亲找到孩子或从孩子找到父亲

堆
    大根堆：一棵完全二叉树，满足任一节点都比其孩子节点大
    小根堆：一棵完全二叉树，满足任一节点都比其孩子节点小

    假设：节点的左右子树都是堆，但自身不是堆
        当根节点的左右子树都是堆时，可以通过一次向下的调整来将其变换成一个堆
    堆排序过程：
        建立堆
        得到堆顶元素，为最大元素
        去掉堆顶，将堆最后一个元素放到堆顶，此时可通过一次调整重新使堆有序。
        堆顶元素为第二大元素。
        重复步骤3，直到堆变空。

归并：
    - 假设现在的列表分成两段有序， 如何将其合成为一个有序列表
    - 从两边分别取，取最小的  ===> 这个过程就叫归并
        肯定有一边先取完，剩下的就不必再比较，直接取下来，xx[:] = xxx[:]

    有了归并如何使用？
        分解： 将列表越分越小，直至分成一个元素。
        一个元素是有序的
        合并： 将两个有序列表归并，列表越来越大。

    时间复杂度：O(nlogn)
    空间复杂度：O(n)

    * 三种排序算法的时间复杂度是O(nlogn)
        - 一般情况下，就运行时间而言：
            快速排序 < 归并排序 <  堆排序

        - 三种排序算法的缺点：
            - 快速排序： 极端情况下排序效率底
            - 归并排序： 需要额外的内存开销
            - 堆排序： 在快的排序算法中相对较慢

希尔排序：
    希尔排序是一种分组插入排序算法。
    首先取一个整数d1=n/2，将元素分为d1个组，每组相邻量元素之间距离为d1，在各组内进行直接插入排序；
    取第二个整数d2=d1/2，重复上述分组排序过程，直到di=1，即所有元素在同一组内进行直接插入排序。
    希尔排序每趟并不使某些元素有序，而是使整体数据越来越接近有序；最后一趟排序使得所有数据有序。

    时间复杂度： O((1+T)n)  # O(1.3n)

排序：
    - 两个排序条件
        姓名、年龄
        排序的稳定性，

冒泡、快排、堆、归并
算法稳定性：
    就是算法的稳定性：假定在待排序的记录序列中，存在多个具有相同的关键字的记录(有相同的元素)，
    若经过排序，这些记录的相对次序保持不变，
    即在原序列中，ri=rj，且ri在rj之前，而在排序后的序列中，ri仍在rj之前，则称这种排序算法是稳定的；否则称为不稳定的。

练习1：
    1、现在有一个列表，列表中的数范围都在0到100之间，列表长度大约为100万，设计算法在O(n)时间复杂度内将列表进行排序。
        - 计数排序，统计每个数出现的次数。只能是数值型，然后再写回列表
        这时使用快排等会比较慢，有大量重复数据

    2、有N(n>1000000)个数，如何取出最大的前10个数？
        - 取列表前10个元素建立一个小根堆。堆顶就是目前第10大的数
        - 依次向后遍历原列表，对于列表中的元素，如果小于堆顶，则忽略该元素；如果大于堆顶，则将堆顶更换为该元素，并且对堆进行一次调整；
        - 遍历列表所有元素后，倒序弹出堆顶。

    堆----> 优先排列
练习2：
    给定一个升序列表和一个整数，返回该整数在列表中的下标范围。
        例如： 列表[1,2,3,3,3,4,4,5], 若查找3，则返回(2,4)；若查找0，由返回(0，0)

study

#-*- coding: utf-8 -*-

# Wind clear raise

# 2017/7/22 下午4:33

import random

import runtime

@runtime.call_time

def bubble_sort(x):

    print(id(x))

    for i in range(len(x)-1):

        for j in range(len(x) -i - 1):

            # 相邻两个数相比较

            #

            if x[j] > x[j+1]:

                x[j], x[j+1] = x[j+1], x[j]

@runtime.call_time

def bubble_sort_2(x):

    """冒泡排序优化"""

    print(id(x))

    for i in range(len(x)-1):

        exchange = False

        for j in range(len(x) -i - 1):

            # 相邻两个数相比较

            #

            if x[j] > x[j+1]:

                x[j], x[j+1] = x[j+1], x[j]

                exchange = True

        if not exchange:

            print(exchange)

            break

#选择排序

@runtime.call_time

def select_sort(li):

    for i in range(len(li) -1 ):

        min_loc = i

        for j in range(i+1, len(li)):

            if li[j] < li[min_loc]:

                min_loc = j

        li[i], li[min_loc] = li[min_loc], li[i]

#插入排序

@runtime.call_time

def insert_sort(li):

    for i in range(1, len(li)):

        tmp = li[i]

        j = i - 1

        while j >=0 and tmp < li[j]:

            li[j+1] = li[j]

            j -= 1

        li[j+1] = tmp

## 快排

def quick_sort(data, left, right):

    if left < right:

        mid = partition(data, left, right)

        quick_sort(data, left, mid-1)

        quick_sort(data, mid + 1, right)

def partition(data, left, right):

    tmp = data[left]

    while left < right:  # left == right 终止

        while left < right and data[right] >= tmp:

            right -= 1

        data[left] = data[right]

        while left < right and data[left] <= tmp:

            left += 1

        data[right] = data[left]

    data[left] = tmp

    return left

@runtime.call_time

def quick_sort_x(data):

    quick_sort(data, 0 , len(data) -1)

#堆

def sift(data, low, high):

    i = low

    j = 2 * i + 1

    tmp = data[i]

    while j <= high:  # 孩子在堆里

        if j < high and data[j] < data[j+1]: # 如果有右孩子且比左孩子大

            j += 1

        if tmp < data[j]:  # 孩子比根大

            data[i] = data[j]

            i = j    # 新的根

            j = 2 * i + 1   # 新的孩子

        else:

            break

    data[i] = tmp

# 降序

def sift_desc(data, low, high):

    i = low

    j = 2 * i + 1

    tmp = data[i]

    while j <= high:  # 孩子在堆里

        if j < high and data[j] > data[j+1]: # 如果有右孩子且比左孩子小

            j += 1

        if tmp > data[j]:  # 孩子比根小

            data[i] = data[j]

            i = j    # 新的根

            j = 2 * i + 1   # 新的孩子

        else:

            break

    data[i] = tmp

@runtime.call_time

def heap_sort(data):

    n = len(data)

    # print(data)

    # 最后一个有子结点的堆 n // 2 -1

    for i in range(n // 2 -1, -1, -1):

        sift(data, i, n -1)

    # 堆建好了。。

    # print(data)

    for i in range(n -1, -1, -1):   # i指向堆的最后

        data[0], data[i] = data[i], data[0]  # 领导退休，下属上位

        sift(data, 0, i - 1)   # 调整新领导

    # print(data)

## 归并

def merge(li, low, mid, high):

    i = low

    j = mid + 1

    ltmp = []

    while i <= mid and j<=high:

        if li[i] < li[j]:

            ltmp.append(li[i])

            i += 1

        else:

            ltmp.append(li[j])

            j += 1

    while i<= mid:

        ltmp.append(li[i])

        i += 1

    while j<= high:

        ltmp.append(li[j])

        j += 1

    li[low:high+1] = ltmp

def mergesort(li, low, high):

    if low < high:

        mid = (low + high) // 2

        # print(low, high, mid)

        mergesort(li, low, mid)

        mergesort(li, mid+1, high)

        merge(li, low, mid, high)

@runtime.call_time

def mergesort_x(*args):

    mergesort(*args)

# 希尔

@runtime.call_time

def shell_sort(li):

    gap = len(li) // 2

    while gap >0:

        for i in range(gap, len(li)):

            tmp = li[i]

            j = i - gap

            while j >= 0 and tmp < li[j]:

                li[j+gap] = li[j]

                j -= gap

            li[j + gap] = tmp

        gap //= 2

import copy

data = list(range(10000))

#

random.shuffle(data)  # 打乱一个列表

data1 = copy.deepcopy(data)

data2 = copy.deepcopy(data)

data3 = copy.deepcopy(data)

data4 = copy.deepcopy(data)

# data = [1, 5, 3, 7, 8, 9]

# bubble_sort(data)

# random.shuffle(data)

# bubble_sort_2(data)

# print(id(data))

##xxx 1 5 3 7 8 9

## 5 4 8 3 9

# data = [5, 4, 8, 3, 9]

# insert_sort(data2)

# select_sort(data1)

# bubble_sort_2(data4)

# print(data)

print("快排")

quick_sort_x(data3)

# print(data3)

print("堆")

heap_sort(data1)

# 归并

print("归并")

mergesort_x(data4, 0, len(data4)-1)

print("shell sort")

shell_sort(data2)

# print(data2)

def topn(li, n=10):

    heap = li[0:n]

    for i in range(n//2-1, -1, -1):

        sift(heap, i, n-1)

    for i in range(n, len(li)):

        if li[i] > heap[0]:

            heap[0] = li[i]

            sift(heap, 0, n -1 )

    for i in range(n -1, -1, -1):

        heap[0], heap[i] = heap[i], heap[0]

        sift(heap, 0, i-1)

    return heap

study.py

Python 第八阶段学习记录之---算法的更多相关文章

Python 第五阶段学习记录之---Django 进阶
Model 一.创建表 1.基本结构字段 AutoField(Field) - int自增列,必须填入参数 primary_key=True BigAutoField(AutoField) - bi ...
Python 第五阶段学习记录之---Django 基础
Python的WEB框架有Django.Tornado.Flask 等多种,Django相较与其他WEB框架其优势为:大而全,框架本身集成了ORM.模型绑定.模板引擎.缓存.Session等诸多功能. ...
Python 第五阶段学习记录之--- Web框架
什么是web服务器的原理是什么 Web框架本质众所周知,对于所有的Web应用,本质上其实就是一个socket服务端,用户的浏览器其实就是一个socket客户端. #!/usr/bin/env pyt ...
Python 第五阶段学习记录之----ORM
ORM: orm英文全称object relational mapping,就是对象映射关系程序,简单来说我们类似python这种面向对象的程序来说一切皆对象,但是我们使用的数据库却都是关系型的,为了 ...
Python 第五阶段学习记录之----rabbmit
消息服务器rabbmit RabbitMQ 消息队列 python里有两个Q, threading queue.不同线程间数据交互进程Queue: 不同进程间交互这个说法是错误的. 这个是用于父进程 ...
python 第四阶段学习记录之----异步
异步: 知识情况: 1.多线程, 多线程使用场景 1.IO操作不占CPU,读写数据(网络中.系统中) 2.计算占CPU, 3.上下文切换不占CPU.它消耗资源 python多线程不适合CPU密集型的 ...
Python 第四阶段学习记录之----多线程
多线程多线程例子, 注释部份即为多线程的使用 #-*- coding: utf-8 -*- # Wind clear raise # 2017/3/5 下午2:34 import socket im ...
孤荷凌寒自学python第八十二天学习爬取图片2
孤荷凌寒自学python第八十二天学习爬取图片2 (完整学习过程屏幕记录视频地址在文末) 今天在昨天基本尝试成功的基础上,继续完善了文字和图片的同时爬取并存放在word文档中. 一.我准备爬取一个有文 ...
Python第八课学习
Python第八课学习 www.cnblogs.com/resn/p/5800922.html 1 Ubuntu学习根 / /: 所有目录都在 /boot : boot配置文件,内核和其他 linu ...

随机推荐

Laravel使用心得
Laravel使用心得 1.session使用 laravel的session使用时,不要使用exit和die,否则session会为空. 2.ajax提交注意框架对post的CSRF保护在头加上& ...
Gradle入门与使用
注:此篇博客主要是看官网的学习笔记:https://docs.gradle.org/current/userguide/installation.html 一.安装: 1.Gradle有内置的groo ...
AWS Add Key Pair to Elastic Beanstalk Instance 给EB实例加密钥
Go to Elastic Beanstalk -> Configuration -> Security -> Virtual machine permissions -> E ...
C# WinForm：无法访问已释放的对象
C#在父窗口中调用子窗口的过程: 1. 创建子窗口对象 2. 显示子窗口对象笔者的程序中,主窗体MainFrm通过菜单调用子窗口ChildFrm.在窗体中定义了子窗口对象,然后在菜单项点击事件中 ...
MVC 向页面传值方式总结（1）
ViewData传值. HomeController.cs Co de: public ActionResult Index() { ViewData["Title" ...
［JAVA] TicTacToe实现Socket通信（一）
先来两张预览,大家可以试试jar包了,有什么问题评论哈,过两天贴代码 jar包这里下载 https://github.com/Andy-ZYA/TicTacToe_JAVA_Socket_Swing
模板设计在tomcat中的应用
tomcat是一个常见的web容器,用户使用它可以很方便地管理servlet小程序,而servlet与tomcat的交互代码设计就用到了模板设计. 何谓模板设计,就是定义一个抽象父类,在该父类中组织子 ...
Jquery获取输入框属性file，ajax传输后端，下载图片
Django web开发获取input属性file,可以用request.FILES.get(' ')直接获取到,然后正常拼接路径就可以下载, 但是今天我们来用异步获取file的值在传输后端下载. 1 ...
Java面试题和解答(一)
1.说说JVM原理?内存泄露与溢出区别,何时产生内存泄露? JVM原理 :http://www.cnblogs.com/jiayi/archive/2010/06/08/1753863.html 内存 ...
【git】强制覆盖本地代码（与git远程仓库保持一致）
git强制覆盖: git fetch --all git reset --hard origin/master git pull git强制覆盖本地命令(单条执行): git ...

Python 第八阶段 学习记录之---算法

Python 第八阶段 学习记录之---算法的更多相关文章

随机推荐

热门专题

Python 第八阶段学习记录之---算法

Python 第八阶段学习记录之---算法的更多相关文章