在前6节课讲的排序方法(冒泡排序,归并排序,选择排序,插入排序,快速排序,堆排序,二分搜索树排序和AVL排序)都是属于对比模型(Comparison Model).对比模型的特点如下: 所有输入items是黑箱(ADTs, Abstract Data Types): 允许的操作只有对比(<,≤,>,≥,=): 时间消耗 = #对比. 之前绝大部分的对比模型是以决策树的结构出现的,这是因为任何对比模型都可以被认做所有可能对比.它们的结果和答案下的一棵树(原话:Decision Tree: any…
之前第5节课留了个疑问,是关于"时间t被安排进R"的时间复杂度能不能为Ο(log2n)?"和BST时间复杂度Ο(h)的关系.第6节对此继续了深入的探讨.首先我们知道BST的h是指树的高,即从根到叶子结点最长路径的长度.但由于树结构不同平衡情况,高h的结果也不一样,如下图所示:  一.结点的高 由此可以看出,平衡树结构下的高h具有计算性.那么接下来我们再看下各结点的高(height of node)的计算方式,它是从该节点位置下到最底部的叶子节点的最长路径长度 (height…
第4节课仍然是讲排序,但介绍的是一种很高效的堆排序. 在编程过程中,有时候会需要进行extrat_max的操作,即从一个数列里挨个抽取最大值并将其它从原数列中移除.而排序问题也可以看作是一个extract_max的行为,不断的从原始数列中抽取最大值并进行移除,这样挨个抽取的最大值输出后能得到一个降序的数列.为了实现该排序思路,堆排序被提了出来,首先我们的了解下堆的概念: 堆(Heap):一个数列被可视化为一个近似完全二叉树,这个树则为堆.如下图所示: 在堆的基础上,有分:最大堆和最小堆. 最大堆…
关于第2节课<Models of Computation, Document Distance>由于内容过于简单,所以不在这里进行记录,它主要就是讲了Python很多操作是constant time(即无C语言地址指针机制,所以比较费时且耗内存),此外就是谈及了一个文档距离(Document Distance)问题,简单来说就是将文档内所有词形成词袋,用词袋下的特征算余弦距离.需要注意的就是余弦相似度越大,文档就越相似,而余弦距离=1-余弦相似度,因此余弦距离越小,代表文档相似度就越高. 第3…
#include<iostream> #include<ctime> #include <stdio.h> #include<cstring> #include<cstdlib> #include <map> #include <string> using namespace std; // A utility function to get maximum value in arr[] int getMax(int ar…
Radix sort is another linear time sorting algorithm. It sorts (using another sorting subroutine) the numbers from their least significant digits to most significant digits. To guarantee the correctness of radix sort, the sorting subroutine must be st…
经典排序算法 - 基数排序Radix sort 原理类似桶排序,这里总是须要10个桶,多次使用 首先以个位数的值进行装桶,即个位数为1则放入1号桶,为9则放入9号桶,临时忽视十位数 比如 待排序数组[62,14,59,88,16]简单点五个数字 分配10个桶,桶编号为0-9,以个位数数字为桶编号依次入桶,变成下边这样 |  0  |  0  | 62 |  0  | 14 |  0  | 16 |  0  |  88 | 59 | |  0  |  1  |  2  |  3  |  4 | …
为了完成二维数据快速分类,最先使用的是hash分类. 前几天我突然想,既然基数排序的时间复杂度也不高,而且可能比hash分类更稳定,所以不妨试一下. 在实现上我依次实现: 1.一维数组基数排序 基本解决主要问题,涵盖排序,包含改进的存储分配策略. 如果用链表来实现,大量的函数调用将耗费太多时间. 2.二维数组基数排序 主要是实现和原有程序的集成. 一.数据结构 下面是存储节点的主数据结构. typedef struct tagPageList{ int * PagePtr; struct tag…
上一篇提到了计数排序,它在输入序列元素的取值范围较小时,表现不俗.但是,现实生活中不总是满足这个条件,比如最大整形数据可以达到231-1,这样就存在2个问题: 1)因为m的值很大,不再满足m=O(n),计数排序的时间复杂也就不再是线性的: 2)当m很大时,为计数数组申请的内存空间会很大: 为解决这两个问题,本篇讨论基数排序(Radix sort),基数排列的思想是: 1)将先按照某个基数将输入序列的每个元素划分成若干部分,每个部分对排序结果的影响是有优先级的: 2)先按低优先级排序,再按高优先级…
基数排序(Radix Sort) 第一趟:个位 收集: 第二趟:十位 第三趟:百位 3元组 基数排序--不是基于"比较"的排序算法 递增就是把收集的过程返过来 算法效率分析 需要r个辅助队列,空间复杂度 = O(r) 一趟分配O(n),一趟收集O(r),总共d趟分配.收集,总的时间复杂度=O(d(n+r)) 稳定性: 稳定!!! 基数排序的应用 知识回顾…