浅谈时间复杂度- 算法衡量标准Big O

写在前面：

今天有一场考试，考到了Big-O的知识点，考到了一道原题，原题的答案我记住了，但实际题目有一些改动导致答案有所改动，为此作者决定重新整理一下复杂度相关知识点

Efficiency and Complexity。

我觉得的学习Big-O之前有必要先了解一下以下这些知识，其中大部分翻译自我们老师的课件，也有一部分自己理解加入，如果有专业名词翻译错误欢迎指正！

时间复杂度与空间复杂度

在写程序的时候，我们通常需要判断某一个算法或者程序是否可以完成某一项任务。拿12306的铁路订票系统举例，如果完成一次订票需要半个小时或者更久，这是很难被用户认可或者接受的。所以保证等待时间的合理是非常必要的（当然越短越好）。我们将一个算法的时间复杂度作为一个指标，而最终执行时间取决于数据结构的大小。

另一个效率指标就是一个程序需要多少空间去来执行特定任务，但是这个指标在现代的计算机我们考虑的很少。我们一般可以认为空间复杂度取决于数据结构的大小。

我们会发现,作为一个数据存储设备,哈希表有一个很好的时间复杂度为，但代价是会比其它算法使用更多的内存。所以两个复杂度通常是由算法/程序员决定如何最好地为程序平衡取舍

最差和平均复杂度（worst versus average complexity）

另一个很重要的指标就是平均复杂度，有的情况下，平均复杂度要比最差复杂度要重要很多。比如一个日常的软件，这里拿我们经常使用的操作系统Windows来举例子，即使经常死机（此时是最差的情况），只要保证在大部分情况下可以正常的运行就可以，也就是说可以为了保证平均的复杂度比保证最坏情况运行更加重要。而在另外一些情况下，比如录音软件，为了采集连续数据，需要考虑时效性，它完全不能接受软件等待时间太长，这样采集数据就不会连续，录音就会不完整。

而这些也是通过具体的例子来进行权衡的。

具体的性能指标

大多数情况，我们感兴趣的是时间复杂度（time complexity）也就是经常提到的Big-O，因此我们需要了解怎么计算它。一个人可能写了一个程序并且运行，并且看看这个程序运行了多长时间，但是这个程序可能会发生一些意想不到的错误，尤其是对于大型的程序，可能每次运行由于不同的条件会发生很大的变化，并且同样程序会因为处理器，或者数据量，读写速度等很多条件下不同，因此时间并不能很好的衡量一个程序或者算法的性能。而复杂度是最好的方式来衡量一个算法/程序，我们可以用伪代码来计算复杂度，由于伪代码很接近我们写程序，并且不需要花费大部分时间来完成程序（我们的任务不就是来计算时间复杂度吗，所以不需要花费太多时间来计算时间复杂度）

Big O notation

Big O notation是一种描述述函数渐进行为的理论，又被称作Landau’s symbol，其实这部分是高数中的概念。用于表述一个函数增长的多快或者减少的多快。（重点描述加速度），在计算机领域，Big O notation常常用来表达算法时间复杂度和性能的术语，一个算法在执行过程中需要的最大时间或者最大空间。

那么为什么要用O来表示呢？
大O符号是由德国数论学家保罗·巴赫曼（Paul Bachmann）在其1892年的著作《解析数论》（Analytische Zahlentheorie）首先引入的。而这个记号则是在另一位德国数论学家艾德蒙·朗道（Edmund Landau）的著作中才推广的，因此它有时又称为朗道符号（Landau symbol）。代表“order of …”（……阶）的大O，最初是一个大写的希腊字母’Θ’（Omicron），现今用的是英文大写字母’O’，但从来不是阿拉伯数字’0’。

最常见的几种复杂度类型（升序排列）

O(1)：常数，结果是相同的，输入值不影响时间（空间），

O(loglogn),

O(logn)：对数，经典算法：二叉搜索树（AVL数）查找算法，

O(n), 线性，表示随着输入的增加，所需的执行时间（空间）也线性增加，

O(nlogn),

O(n^2),

O(n^3),

O(2^n )

....

我们可以观察不同n值下面具体复杂度的值。

显示在坐标中会更加明显

那么问题是：如何计算呢？

时间复杂度是总运算次数表达式中受n的变化影响最大的那一项(不含系数)

例如：

O(n^2 + 4n + 1) 受 n^2影响最大，于是二次方程我们记为O(n^2)

同理：

O(2n^3 + n^2 + 1) = O(n^3)(此处=不知是否妥当，欢迎网友指正）

O(n+4logn) = O(n)

这里我们引入T(n)概念，时间复杂度的表示法T(n)=O(f(n)) 其中f(n)一般是算法中频度最大的语句频度

例如：

1.数组遍历

for(int i = 0; i < a.length; i++){
    system.out.print(a[i]+" ")
}

很明显遍历数组元素个数n次也就是说f(n) = n,

那么T(n) = O(n)

2.查看数组中是否有重复元素

 for (int i=0; i<n; i++){
     for (int j=i+1; j<n; j++){
         if (a[i]==a[j]) {
             eturn true;
         }
     }
 }
 return false;

分析：

对于第一个for循环，0<i<n，最坏的情况下有n次；分别是n=0，1，2...i...n-1.

对于第二个for循环，i+1<j<n, 最坏的情况下有 n-i-1次，将0<i<n以此代入

即 n-1, n-2, n-3....n-i-1....0

相加便是n(n-1)/2次运算即f(n) = n(n-1)/2

那么T(n) = O(n(n-1)/2)也就是T(n) = O(n^2)

以上是完整的分析方式，但是对于算法来说，我们通常不会如此细致的去分析，因为本来复杂度都是取的最坏的情况因此我们只需要估算。

i = 1；
while(i <= n){
    i = i*2
}

我们可以看到执行f(n)次

也就是2^f(n) <= n

f(n) = log2 n

T(n) = O(f(n)) = O(logn) (这里通常会把log2 n记为 logn）

声明：

本文70%原创， 30%摘抄整理翻译

引用：

http://blog.csdn.net/firefly_2002/article/details/8008987

http://blog.csdn.net/iluna/article/details/4159485

http://www.ehcoo.com/complexity.html

浅谈时间复杂度- 算法衡量标准Big O的更多相关文章

浅谈分词算法（5）基于字的分词方法（bi-LSTM）
目录前言目录循环神经网络基于LSTM的分词 Embedding 数据预处理模型如何添加用户词典前言很早便规划的浅谈分词算法,总共分为了五个部分,想聊聊自己在各种场景中使用到的分词方法做 ...
浅谈分词算法（4）基于字的分词方法（CRF）
目录前言目录条件随机场(conditional random field CRF) 核心点线性链条件随机场简化形式 CRF分词 CRF VS HMM 代码实现训练代码实验结果参考文献 ...
浅谈分词算法（3）基于字的分词方法（HMM）
目录前言目录隐马尔可夫模型(Hidden Markov Model,HMM) HMM分词两个假设 Viterbi算法代码实现实现效果完整代码参考文献前言在浅谈分词算法(1)分词中的 ...
浅谈分词算法基于字的分词方法（HMM）
前言在浅谈分词算法(1)分词中的基本问题我们讨论过基于词典的分词和基于字的分词两大类,在浅谈分词算法(2)基于词典的分词方法文中我们利用n-gram实现了基于词典的分词方法.在(1)中,我们也讨论了 ...
浅谈Manacher算法与扩展KMP之间的联系
首先,在谈到Manacher算法之前,我们先来看一个小问题:给定一个字符串S,求该字符串的最长回文子串的长度.对于该问题的求解.网上解法颇多.时间复杂度也不尽同样,这里列述几种常见的解法. 解法一 ...
浅谈KMP算法及其next[]数组
KMP算法是众多优秀的模式串匹配算法中较早诞生的一个,也是相对最为人所知的一个. 算法实现简单,运行效率高,时间复杂度为O(n+m)(n和m分别为目标串和模式串的长度) 当字符串长度和字符集大小的比值 ...
单模式串匹配----浅谈kmp算法
模式串匹配,顾名思义,就是看一个串是否在另一个串中出现,出现了几次,在哪个位置出现: p.s. 模式串是前者,并且,我们称后一个 (也就是被匹配的串)为文本串: 在这篇博客的代码里,s1均为文本串, ...
浅谈Tarjan算法
从这里开始预备知识两个数组 Tarjan 算法的应用求割点和割边求点-双连通分量求边-双连通分量求强连通分量预备知识设无向图$G_{0} = (V_{0}, E_{0})$,其中$V_ ...
浅谈KMP算法
一.介绍烤馍片KMP算法是用来处理字符串匹配问题的.比如说给你两个字符串A,B,问B是不是A的子串? 比如,eg就是aeggx的子串一般讲字符串A称为主串,用来匹配的B串称为模式串定义n为字符串 ...

随机推荐

css padding和margin的百分比
前段时间我同事对于margin和padding应用百分比值似乎有些误解,觉得可能是个普遍问题,所以觉得有必要拿出来单独写一下. margin和padding都可以使用百分比值的,但有一点可能和通常的想 ...
Leetcode题1
Given an array of integers, find two numbers such that they add up to a specific target number. The ...
STM32启动模式及API（转）
源:STM32启动模式及API 我们玩ARM9,一般都是在内存里调试程序,速度飞快.STM32下也可以这样,虽说现在的flash寿命已经很长了,但flash中调试烧录程序还是一个很慢的过程,有时候程序 ...
FATFS外置UNICODE GBK双向转换码表（转）
源:FATFS外置UNICODE GBK双向转换码表将UtoG,GtoU双向码表放到存储卡里面实现长文件名,因为FATFS长文件名需要unicode支持, 首先将UtoG.sys,GtoU.sys两 ...
jquery中(function($){...})(jQuery)是什么
调用函数时,是在函数后面写上括号和实参的,由于操作符的优先级,函数本身也需要用括号,即:(function(arg){...})(param)而(function($){...}) (jQuery) ...
hisi出的H264码流结构
hisi出的H264码流结构: IDR帧结构如下: 开始码 + nalu + I帧 + 开始码 + nalu + SPS + 开始码 + nalu + PPS + ...
javascript-array函数实例
<script type="text/javascript"> window.onload = function () { // body... var aNew = ...
CreateForm(
/// <summary> /// 打开新的子窗体 /// </summary> /// <param name="strName">窗体的类名 ...
基于Python,scrapy,redis的分布式爬虫实现框架
原文 http://www.xgezhang.com/python_scrapy_redis_crawler.html 爬虫技术,无论是在学术领域,还是在工程领域,都扮演者非常重要的角色.相比于其他 ...
Grunt构建工具插件篇——之less工具2
Grunt任务分为两部分,一部分是任务,即Grunt要执行的代码,找到对应功能的插件就成.所以等会要下载grunt-contrib- less包,这个插件便是把less文件编译成能直接使用的css.另 ...

浅谈时间复杂度- 算法衡量标准Big O

Big O notation

浅谈时间复杂度- 算法衡量标准Big O的更多相关文章

随机推荐

热门专题