2021-01-14:timsort是什么,如何用代码实现?
福哥答案2021-01-14:
答案来自此链接:
介绍:
timsort是一种混合、稳定高效的排序算法,源自合并排序和插入排序,旨在很好地处理多种真实数据。它由Tim Peters于2002年实施使用在Python编程语言中。该算法查找已经排序的数据的子序列,并使用该知识更有效地对其余部分进行排序。这是通过将已识别的子序列(称为运行)与现有运行合并直到满足某些条件来完成的。从版本2.3开始,Timsort一直是Python的标准排序算法。如今,Timsort 已是是 Python、 Java、 Android平台 和 GNU Octave 的默认排序算法。
思想:
针对现实中需要排序的数据分析看,大多数据通常是有部分已经排好序的数据块,Timsort 就利用了这一特点。Timsort 称这些已经排好序的数据块为 “run”,我们可以将其视为一个一个的“分区”。在排序时,Timsort迭代数据元素,将其放到不同的 run 里,同时针对这些 run ,按规则进行合并至只剩一个,则这个仅剩的 run 即为排好序的结果。
换句话说,就是分析待排序数据,根据其本身的特点,将排序好的(不管是顺序还是逆序)子序列的分为一个个run分区,当然,这个分区run也存在一定的约束,即根据序列会产生一个minrun,如果原始的run小于minrun的长度,用插入排序扩充run,直到达到条件,之后使用归并排序来合并多个run。
知乎:
首先,timsort是Python里默认的排序算法,直接就可以在cPython的源码里找到,我没记错的话好像是600多行。
timsort改进自归并排序,因为待排序数据中是一定存在一些连续递增和连续严格递减子序列的,那么timsort会找到这样的子序列,称其为run。之后便是把严格递减的run反向,整个序列就变成了好多好多个递增的run。
然后就是使用归并排序的方式merge相邻的run,等到数组中只剩下一个run的时候自然就排好序了。
实际实现时,扫描出一个run就要分析一下已有的runs要不要合并,主要是通过最后面的两到三个run的长度来进行判断。
如果初始run的数量恰好为2的整数次幂或者略小于2的整数次幂,可以进一步避免长度差距太大的两个run的合并。(如果一个run的长度大于另一个run的两倍,就可以认为差距过大了)
所以要对长度过短的run使用插入排序进行扩充,最终要保证初始run的长度在32和64之间(记不清边界条件了,没敢写成区间形式),这样可以保证长度过短时用插入排序提高效率,初始run的长度较为接近,数量也保证了后续不会存在过多的差距过大的run的合并。
在合并的时候也没有使用普通的归并排序的方式,但唯独这一小块我还不太了解。之前自己用C++语言写过一个不完整的timsort,自认为还算是比较了解的,当然合并不同的run我用的是普通的归并排序的方式。
时间有限,timesort只是了解了大概。代码参考了其他文献,用go语言改写。代码里是非原地排序。代码如下:
package main
import (
"fmt"
"math/rand"
"time"
)
//https://blog.csdn.net/sinat_35678407/article/details/82974174
func main() {
rand.Seed(time.Now().Unix())
SucCount := 0
FaiedCount := 0
for i := 0; i < 1000; i++ {
arr1 := NewRandArr()
arr2 := make([]int, len(arr1))
copy(arr2, arr1)
fmt.Println("原数组:", arr1)
arr1 = timsort(arr1)
fmt.Println("timsort排序:", arr1)
SelectionSort(arr2)
fmt.Println("选择排序:", arr2)
isEqual := true
for j := 0; j < len(arr1); j++ {
if arr1[j] != arr2[j] {
isEqual = false
fmt.Println("错误")
break
}
}
if isEqual {
SucCount++
} else {
FaiedCount++
}
fmt.Println("----")
}
fmt.Println("成功 = ", SucCount)
fmt.Println("失败 = ", FaiedCount)
}
func binary_search(arr []int, left int, right int, value int) int {
if left >= right {
if arr[left] <= value {
return left + 1
} else {
return left
}
} else {
mid := left + (right-left)>>1
if arr[mid] < value {
return binary_search(arr, mid+1, right, value)
} else {
return binary_search(arr, left, mid-1, value)
}
}
}
func insertion_sort(arr []int) []int {
arrLen := len(arr)
ret := make([]int, 0)
for i := 1; i < arrLen; i++ {
value := arr[i]
pos := binary_search(arr, 0, i-1, value)
ret = append(ret, arr[:pos]...)
ret = append(ret, value)
ret = append(ret, arr[pos:i]...)
ret = append(ret, arr[i+1:]...)
}
return ret
}
func merge(l1 []int, l2 []int) []int {
l1Len := len(l1)
if l1Len <= 0 {
return l2
}
l2Len := len(l2)
if l2Len <= 0 {
return l1
}
ret := make([]int, 0)
if l1[0] < l2[0] {
ret = append(ret, l1[0])
ret = append(ret, merge(l1[1:], l2)...)
} else {
ret = append(ret, l2[0])
ret = append(ret, merge(l1, l2[1:])...)
}
return ret
}
func timsort(arr []int) []int {
arrLen := len(arr)
if arrLen <= 1 {
return arr
}
runs := make([][]int, 0)
//sorted_runs := make([][]int, 0)
new_run := []int{arr[0]}
for i := 1; i < arrLen; i++ {
if arr[i] < arr[i-1] {
runs = append(runs, new_run)
new_run = []int{arr[i]}
} else {
new_run = append(new_run, arr[i])
}
if arrLen-1 == i {
runs = append(runs, new_run)
break
}
}
for i := 0; i < len(runs); i++ {
insertion_sort(runs[i])
}
sorted_arr := make([]int, 0)
for i := 0; i < len(runs); i++ {
sorted_arr = merge(sorted_arr, runs[i])
}
//fmt.Println(sorted_arr)
return sorted_arr
}
//选择排序
func SelectionSort(arr []int) {
arrlen := len(arr)
if arrlen < 2 {
return
}
// 0~n-1
// 1~n-1
// 2~n-1
for i := 0; i < arrlen; i++ { // i ~ N-1
// 最小值在哪个位置上 i~n-1
minIndex := i
for j := i + 1; j < arrlen; j++ { // i ~ N-1 上找最小值的下标
if arr[j] < arr[minIndex] {
minIndex = j
}
}
arr[i], arr[minIndex] = arr[minIndex], arr[i]
}
}
//产生一个随机数组
func NewRandArr() []int {
Len := rand.Intn(100) + 1
ret := make([]int, Len)
for i := 0; i < Len; i++ {
ret[i] = rand.Intn(1000)
}
return ret
}
执行结果如下:

2021-01-14:timsort是什么,如何用代码实现?
Timsort——自适应、稳定、高效排序算法
2021-01-14:timsort是什么,如何用代码实现?
评论
2021-01-14:timsort是什么,如何用代码实现?的更多相关文章
- app后端设计(2)--xmpp的使用(2014.01.14更新)
在app中有时候是需要添加聊天服务,在这里谈谈曾经开发聊天服务的经验: (1)聊天服务端选的openfire,这是一个基于xmpp协议的聊天服务器(XMPP是一种基于XML的协议,它继承了在XML环境 ...
- 2021.11.14 CF1583E Moment of Bloom(LCA+图上构造)
2021.11.14 CF1583E Moment of Bloom(LCA+图上构造) https://www.luogu.com.cn/problem/CF1583E 题意: She does h ...
- 2021.05.14 tarjan
2021.05.14 tarjan 标准版tarjan 这里使用数组来模拟栈 void tarjan(int x){ ++ind; dfn[x]=low[x]=ind; stacki[++top]=x ...
- MOSS2010中如何用代码给托管元数据类型的栏目赋值
最近项目中遇到如何用代码给托管元数据类型的栏目赋值问题,经过折腾,现把我的思路和实现方法共享出来,让大家一起来学习学习.相互探讨下. /// <summary> /// 托管元数据 /// ...
- 如何用代码的方式取出SAP C4C销售订单创建后所有业务伙伴的数据
比如我创建了一个Sales Order(销售订单)后,如何用代码的方式取出这些通过SAP Partner determination自动填充的Involved Parties信息呢? 一种方法可以使用 ...
- Android | 教你如何用代码一键实现银行卡绑定
前言 小编前面几期文章分别给大家介绍了用代码实现微笑抓拍.证件照DIY.拍照翻译的功能开发(链接见文章末尾),本次小编给大家带来的是用代码一键实现银行卡识别与绑定功能. 银行卡识别的应用场景 ...
- 088 01 Android 零基础入门 02 Java面向对象 02 Java封装 01 封装的实现 02 封装的代码实现
088 01 Android 零基础入门 02 Java面向对象 02 Java封装 01 封装的实现 02 封装的代码实现 本文知识点:Java封装的代码实现 说明:因为时间紧张,本人写博客过程中只 ...
- Noip模拟76 2021.10.14
T1 洛希极限 上来一道大数据结构或者单调队列优化$dp$ 真就没分析出来正解复杂度 正解复杂度$O(q+nm)$,但是据说我的复杂度是假的 考虑一个点转移最优情况是从它上面的一个反$L$形转移过来 ...
- Noip模拟53 2021.9.14
T1 ZYB和售货机 首先这道题有两种做法. 一种是发现每个点都可以先被取到只剩一个,只要收益大于$0$ 然后发现建一个$i->f[i]$的图时出现环,要把它去掉, 那么跑一个$tarjan$枚 ...
- Noip模拟39 2021.8.14
T1 打地鼠 都切掉了的简单题 1 #include<bits/stdc++.h> 2 #define int long long 3 using namespace std; 4 con ...
随机推荐
- CalledFromWrongThreadException
更新UI的位置不正确,线程解析数据 handler. mssage 中更新 android.view.ViewRootImpl$CalledFromWrongThreadException: O ...
- Stable Diffusion
Stable Diffusion ...using diffusers Stable Diffusion is a text-to-image latent diffusion model cre ...
- CCF PTA编程培训师资认证
考试费用: 双会员500元,任意一方单会员750元,报名考试同时成为CCF专业会员850元,非会员1000元. P/T2补考费用:双会员200元,任意一方单会员300元,非会员400元. T1补考费用 ...
- 使用 Alacritty 替代 Gnome-Terminal 解决 Ubuntu 中终端的行间距问题
我之前发了一篇随笔新版 Ubuntu 中 gnome-terminal 可恶的行间距问题逼我退回了 Ubuntu 20.04,描述了新版 Ubuntu 中终端的行间距问题.评论中给出了一个解决办法,那 ...
- oracle命令2 和一致性关闭、非一致性关闭
启动SQL*Plus语法sqlplus [username/password][@server] [as sysdba|sysoper] ,其中username/password如果不输人,SQL*P ...
- 2023-10-25:用go语言,假如某公司目前推出了N个在售的金融产品(1<=N<=100) 对于张三,用ai表示他购买了ai(0<=ai<=10^4)份额的第i个产品(1<=i<=N) 现给出K(
2023-10-25:用go语言,假如某公司目前推出了N个在售的金融产品(1<=N<=100) 对于张三,用ai表示他购买了ai(0<=ai<=10^4)份额的第i个产品(1& ...
- Windows没有足够信息,不能验证该证书",是因为该证书的颁发者
Windows没有足够信息,不能验证该证书",无法验证该证书的颁发者 解决方案之一: 1.win+R:打开运行 2.输入 gpedit.msc,确定,打开组策略 3.选择:计算机配置---管 ...
- YbtOJ 「图论」第3章 最短路径
例题1.单源最短路径 dij 板子.(w36557658 原版 dij 代码! code #include<cmath> #include<queue> #include< ...
- RLChina理论三:强化学习基础
强化学习基础 马尔可夫决策过程就是在,环境自发做出转变,是个随波逐流的过程,At是智能体的行动,在St环境状态下加入At动作,c才进入下个状态S(t+1),即环境有自己的变化,也加入了智能体的决策. ...
- 【scipy 基础】--积分和微分方程
对于手工计算来说,积分计算是非常困难的,对于一些简单的函数,我们可以直接通过已知的积分公式来求解,但在更多的情况下,原函数并没有简单的表达式,因此确定积分的反函数变得非常困难. 另外,相对于微分运算来 ...