使用并行的方法计算斐波那契数列 (Fibonacci)

更新：我的同事Terry告诉我有一种矩阵运算的方式计算斐波那契数列，更适于并行。他还提供了利用TBB的parallel_reduce模板计算斐波那契数列的代码（在TBB示例代码的基础上修改得来，比原始代码更加简洁易懂）。实验结果表明，这种方法在计算的斐波那契数列足够长时，可以提高性能。

矩阵方式计算斐波那契数列的原理：

代码：

#include <tbb/task_scheduler_init.h>

#include <tbb/blocked_range.h>

#include <tbb/parallel_reduce.h>

#include <tbb/tick_count.h>

#include <stdio.h>

using namespace std;

using namespace tbb;

//! Matrix 2x2 class

struct Matrix2x2

{

    //! Array of unsigned ints

    unsigned int v[][];

    Matrix2x2() {}

    Matrix2x2(unsigned int v00, unsigned int v01, unsigned int v10, unsigned int v11) {

        v[][] = v00; v[][] = v01; v[][] = v10; v[][] = v11;

    }

    Matrix2x2 operator * (const Matrix2x2 &to) const; //< Multiply two Matrices

};

//! matrix to be multiplied

static const Matrix2x2 Matrix1110(, , , );

//! Identify matrix to be served as the base of the product

static const Matrix2x2 Matrix1001(, , , );

//! Raw arrays matrices multiply

void Matrix2x2Multiply(const unsigned int a[][], const unsigned int b[][], unsigned int c[][])

{

    for( int i = ; i <= ; i++)

        for( int j = ; j <= ; j++)

            c[i][j] = a[i][]*b[][j] + a[i][]*b[][j];

}

Matrix2x2 Matrix2x2::operator *(const Matrix2x2 &to) const

{

    Matrix2x2 result;

    Matrix2x2Multiply(v, to.v, result.v);

    return result;

}

unsigned int serialFibo(unsigned int n)

{

    if (n < ) {

        return n;

    }

    else

    {

        Matrix2x2 product = Matrix1110;

        for (int i = ; i < n; i++)

        {

            product = Matrix1110*product;

        }

        return product.v[][];

    }

}

//! Functor for parallel_reduce

struct parallel_reduceFibBody {

    Matrix2x2 product;

    //! Constructor fills product with initial matrix

    parallel_reduceFibBody() : product( Matrix1001 ) { }

    //! Splitting constructor

    parallel_reduceFibBody( parallel_reduceFibBody& other, split ) : product( Matrix1001 ){}

    //! Join point

    void join( parallel_reduceFibBody &s ) {

        product = product * s.product;

    }

    //! Process multiplications

    void operator()( const blocked_range<int> &r ) {

        for( int k = r.begin(); k < r.end(); ++k )

            product = product * Matrix1110;

    }

};

unsigned int parallelFibo(unsigned int n)

{

    parallel_reduceFibBody b;

    parallel_reduce(blocked_range<int>(, n, ), b);

    return b.product.v[][];

}

int main(int argc, const char * argv[])

{

    task_scheduler_init init;

    unsigned int a = ;

    // serial Fibo

    //

    tick_count start1 = tick_count::now();

    unsigned int serialResult = serialFibo(a);

    tick_count end1 = tick_count::now();

    tick_count::interval_t time1 = end1 - start1;

    printf("serial fibo(%u) = %u, calculated in %f seconds\n", a, serialResult, time1.seconds());

    // parallel Fibo

    //

    tick_count start2 = tick_count::now();

    unsigned int parallelResult = parallelFibo(a);

    tick_count end2 = tick_count::now();

    tick_count::interval_t time2 = end2 - start2;

    printf("parallel fibo(%u) = %u, calculated in %f seconds\n", a, parallelResult, time2.seconds());

    return ;

}

实验结果：

serial fibo(40000) = 160266427, calculated in 0.001070 seconds

parallel fibo(40000) = 160266427, calculated in 0.000568 seconds

=====================以下为老的博文==========================

今天给公司同事做关于并行编程的内部培训，大家对是否能用并行的方法计算斐波那契数列（Fibonacci），以及使用并行的方法能否提高其性能进行了一些讨论。

我的结论是：

1.可以使用并行的方法计算。

2. 至于能否提高性能，与计算斐波那契数列的实现方式有关。若采用最基础的递归方式，则对于“类似递归实现的计算斐波那契数列问题”，如果问题的计算量够大，则可能提高性能。如果用循环的方式实现斐波那契数列，则并行无论如何无法提高性能。

下面利用苹果的并行程序库GCD(Grand Central Dispatch)，写了一段代码来验证我的结论。为了仿真“大计算量的用递归实现的类斐波那契数列问题”，我在计算斐波那契数列的函数里加入了sleep 两秒的语句。实验结果显示，仅在这种方式下并行可以提高性能。

下面是代码和实验结果：

代码：

#import <Foundation/Foundation.h>

unsigned int recursiveFibo(unsigned int n)

{

    [NSThread sleepForTimeInterval:2];

    if (n < 2)

        return n;

    else

        return recursiveFibo(n-1) + recursiveFibo(n-2);

}

unsigned int loopFibo(unsigned int n)

{

    if (n < 2)

    {

        [NSThread sleepForTimeInterval:2];

        return n;

    }

    else

    {

        int fisub1 = 1;

        int fisub2 = 0;

        int fi = 0;

        for (unsigned int i = 2; i < n+1; i++)

        {

            [NSThread sleepForTimeInterval:2];

            fi = fisub1 + fisub2;

            fisub2 = fisub1;

            fisub1 = fi;

        }

        return fi;

    }

}

int main(int argc, const char* argv[])

{

    unsigned int a = 6;

    NSLog(@"serial caculating Fibonacci(%u)...", a);

    double start1 = [[NSDate date] timeIntervalSince1970];

    unsigned int fibo1 = loopFibo(a);

    double end1 = [[NSDate date] timeIntervalSince1970];

    NSLog(@"fibonacci(%u) = %u, cost %f seconds", a, fibo1, end1-start1);

    NSLog(@"parallel calculateing Fibonacci(%u)...", a);

    double start2 = [[NSDate date] timeIntervalSince1970];

    __block unsigned int fibo2sub1 = 0;

    __block unsigned int fibo2sub2 = 0;

    dispatch_group_t group = dispatch_group_create();

    dispatch_group_async(group, dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0), ^{fibo2sub1 = loopFibo(a-1);});

    dispatch_group_async(group, dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0), ^{fibo2sub2 = loopFibo(a-2);});

    dispatch_group_wait(group, DISPATCH_TIME_FOREVER);

    [NSThread sleepForTimeInterval:2];

    unsigned int fibo2 = fibo2sub1 + fibo2sub2;

    double end2 = [[NSDate date] timeIntervalSince1970];

    NSLog(@"fibonacci(%u) = %u, cost %f seconds", a, fibo2, end2 - start2);

    dispatch_release(group);

    return (0);

} //main

实验结果：

如果用递归实现（主程序中调用recursiveFibo），

对于“大计算量的类斐波那契数列问题”，并行可以提高性能。

2013-07-18 17:42:04.613 recursiveFibo[34666:303] serial caculating Fibonacci(6)...

2013-07-18 17:42:54.636 recursiveFibo[34666:303] fibonacci(6) = 8, cost 50.021813 seconds

2013-07-18 17:42:54.637 recursiveFibo[34666:303] parallel calculateing Fibonacci(6)...

2013-07-18 17:43:26.651 recursiveFibo[34666:303] fibonacci(6) = 8, cost 32.013492 seconds

如果把代码中的sleep语句全部注释掉，单纯计算斐波那契数列，则并行无法提高性能：

2013-07-18 18:04:39.885 recursiveFibo[35617:303] serial caculating Fibonacci(6)...

2013-07-18 18:04:39.888 recursiveFibo[35617:303] fibonacci(6) = 8, cost 0.000017 seconds

2013-07-18 18:04:39.889 recursiveFibo[35617:303] parallel calculateing Fibonacci(6)...

2013-07-18 18:04:39.890 recursiveFibo[35617:303] fibonacci(6) = 8, cost 0.000246 seconds

如果用循环实现（主程序中调用loopFibo），则无论计算量的大小，并行均不可能提高性能。

对于“大计算量的类斐波那契数列问题”,实验结果是：

2013-07-19 07:20:32.382 loopFibo[37029:303] serial caculating Fibonacci(6)...

2013-07-19 07:20:34.385 loopFibo[37029:303] fibonacci(6) = 8, cost 10.004636 seconds

2013-07-19 07:20:34.386 loopFibo[37029:303] parallel calculateing Fibonacci(6)...

2013-07-19 07:20:38.389 loopFibo[37029:303] fibonacci(6) = 8, cost 10.005218 seconds

对于单纯计算斐波那契数列，实验结果是：

2013-07-19 07:31:59.530 loopFibo[37404:303] serial caculating Fibonacci(6)...

2013-07-19 07:31:59.532 loopFibo[37404:303] fibonacci(6) = 8, cost 0.000013 seconds

2013-07-19 07:31:59.532 loopFibo[37404:303] parallel calculateing Fibonacci(6)...

2013-07-19 07:31:59.533 loopFibo[37404:303] fibonacci(6) = 8, cost 0.000042 seconds

从此文也可以看出，用循环的方式实现斐波那契数列是一种更好的方式。

使用并行的方法计算斐波那契数列 (Fibonacci)的更多相关文章

C# 4种方法计算斐波那契数列 Fibonacci
F1: 迭代法最慢,复杂度最高 F2: 直接法 F3: 矩阵法参考<算法之道(The Way of Algorithm)>第38页-魔鬼序列:斐波那契序列 F4: 通项公式法由于公式 ...
以计算斐波那契数列为例说说动态规划算法（Dynamic Programming Algorithm Overlapping subproblems Optimal substructure Memoization Tabulation）
动态规划(Dynamic Programming)是求解决策过程(decision process)最优化的数学方法.它的名字和动态没有关系,是Richard Bellman为了唬人而取的. 动态规划 ...
java 递归及其经典应用--求阶乘、打印文件信息、计算斐波那契数列
什么是递归我先看下百度百科的解释: 一种计算过程,如果其中每一步都要用到前一步或前几步的结果,称为递归的.用递归过程定义的函数,称为递归函数,例如连加.连乘及阶乘等.凡是递归的函数,都是可计算的,即 ...
关于Haskell计算斐波那契数列的思考
背景众所周知,Haskell语言是一门函数式编程语言.函数式编程语言的一大特点就是数值和对象都是不可变的,而这与经常需要对状态目前的值进行修改的动态规划算法似乎有些"格格不入", ...
Android NDK入门实例计算斐波那契数列一生成jni头文件
最近要用到Android NDK,调用本地代码.就学了下Android NDK,顺便与大家分享.下面以一个具体的实例计算斐波那契数列,说明如何利用Android NDK,调用本地代码.以及比较本地代码 ...
用递归方法计算斐波那契数列（Recursion Fibonacci Sequence Python)
先科普一下什么叫斐波那契数列,以下内容摘自百度百科: 斐波那契数列(Fibonacci sequence),又称黄金分割数列.因意大利数学家列昂纳多·斐波那契(Leonardoda Fibonacci ...
斐波那契数列-java编程：三种方法实现斐波那契数列
题目要求:编写程序在控制台输出斐波那契数列前20项,每输出5个数换行斐波那契数列指的是这样一个数列:1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, … 这个数列 ...
shell脚本计算斐波那契数列
计算斐波那契数列 [1,1,2,3,5,8,,,,,] #!/bin/bash n=$ num=( ) i= while [[ $i -lt $n ]] do let num[$i]=num[$i-] ...
python实现斐波那契数列(Fibonacci sequence)
使用Python实现斐波那契数列(Fibonacci sequence) 斐波那契数列形如 1,1,2,3,5,8,13,等等.也就是说,下一个值是序列中前两个值之和.写一个函数,给定N,返回第N个斐 ...

随机推荐

c#检测端口是否被占用
当我们要创建一个Tcp/Ip Server connection ,我们需要一个范围在1000到65535之间的端口 . 但是本机一个端口只能一个程序监听,所以我们进行本地监听的时候需要检测端口是否被 ...
五、Spring ——单元测试
1.JUnit4 JUnit测试用例的完整生命周期要经历一下阶段:类级初始化资源处理,方法级初始化资源处理.执行测试用例中的方法.方法级销毁资源处理.类级销毁资源处理. 测试方法 @Test 初始化 ...
IO 输入流操作
//get.h #ifndef GET_H #define GET_H #include <iostream> std::istream& get(std::istream& ...
全面了解 Linux 服务器 - 2. 查看 Linux 服务器的内存使用情况
2. 查看 Linux 服务器的内存使用情况 liuqian@ubuntu:~$ free -m total used free shared buffers cached Mem: 1983 186 ...
如何在LLDB下排查message sent to deallocated instance问题
转:http://www.devdiv.com/home.php?mod=space&uid=50901&do=blog&id=50856 在XCode的以前版本中,如果遇到了 ...
飞凌OK6410开发板SDIO无线8189WIFI模块驱动移植
为什么要移植?开发板不是已经提供了无线驱动吗? 貌似是这样的..本来是好用的.加入自己第三方驱动后发现WIFI用不了...最后发现飞凌提供的内核里面没有8189芯片的代码...问售后他们说那边是好的. ...
Monty Hall Problem的一个图解，感觉不错
从Coursera.org上的台大概率课讨论组里拿来的如果不转换,选中汽车的概率是1/3,非常显然. 但转换后选中汽车的概率变成2/3就有点反直觉了,并不是太容易想明白. 因为转换其实有4种:汽车- ...
zookeeper启动。
package com.autonavi.tinfo.traffic.zookeeper; import java.util.Arrays; import java.util.Collections; ...
一个最小化的SpringBoot项目
项目结构项目基于Maven管理,注意使用了父pom <parent> <groupId>org.springframework.boot</groupId> &l ...
mysql的时间转化
1.1 获得当前日期+时间(date + time)函数:now() 除了 now() 函数能获得当前的日期时间外,MySQL 中还有下面的函数: current_timestamp() curr ...

使用并行的方法计算斐波那契数列 (Fibonacci)

使用并行的方法计算斐波那契数列 (Fibonacci)的更多相关文章

随机推荐

热门专题