paip.提升性能--多核cpu中的java/.net/php/c++编程









作者Attilax  艾龙,  EMAIL:1466519819@qq.com 

来源:attilax的专栏

地址:http://blog.csdn.net/attilax









////////////////目前情况

需要一个处理50w行的文件,按行进行分词..需要50s才能完成..

经过调试,瓶颈在这个代码上... TokenStream ts = Analyzer.tokenStream("", reader); 换成IKSegmenter方式,还是一样.,
// IKSegmenter ik=new IKSegmenter(reader, true);

机器环境:win7 64bit..cpu双核,2.7g...内存8g

查看cpu使用,仅仅使用了1个cpu,另外一个空闲着了...要全部使用了,性能应该能行提升2倍了..





 

////////////使用多线程来提升多核cpu的性能..

多核随着硬件的不断升级,作为计算机核心的CPU也改头换面,成为一颗多心的家伙。设计它的专家声称这可以最大限度地提高程序的运行效率。但事实真的如此吗?众所周知,现在的程序大多都是基于单线程而设计的,然而这种设计模式如果在主频高的单核CPU上运行,效率是非常高的。但它并不能很好地协调多核一起工作。





更不幸的是单线程的程序在多核CPU上运行甚至可能会没有单核CPU快。





当然,就目前而言,要解决这种性能软瓶颈的最佳方法就是本专题所讨论的多线程编程。只有充分利用这种技术,才能发挥多核的最大潜力。好了,就说到这吧,最后让我们利用本专题所讲的内容尽情地享受多核给我们带来的惊喜和刺激吧!









2、线程分解和执行的区别:

对单核CPU,对客户端软件,采用多线程,主要是 创建多线程将一些计算放在后台执行,而不影响用户交互操作。(用户界面 & 其他计算 并行进行)提高用户的操作性能!





多核中,分别出多个线程,不再限于将用户界面操作和其他计算分离。分解多个线程使为了让计算分配到各CPU上执行。执行线程数量与CPU核数有关!如果线程数小于核数,某些CPU肯定处于空闲状态。





3、CPU核负载平衡:

单核中不考虑 负载平衡,各个线程计算量相差很大,也不会影响程序总计算时间。

多核中,必须考虑将各个线程计算量均衡到各CPU





7、串行计算与并行计算、分布式计算的区别

单核多线程编程中,都是串行算法。用不到并行计算,更用不到分布式计算

多核编程中,多采用 并行计算 和 分布式计算





并行计算=并行设计模式+并行算法

分布式计算复杂度 > 并行计算的复杂度 > 串行计算复杂度





并行计算:只考虑计算并行地执行,不考虑线程间的竞争导致CPU饥饿

分布式计算:相比并行计算,能更好解决CPU饥饿,使计算均衡地分配任务到各内核





/////////////////代码如下:

经过测试,因为仅仅有2个cpu核心,走凯里2个线程..果然,2个cpu占用都块道理100%的兰,时间一挂噪城里原来的一半儿..25s走ok兰...

List<String> lica7 = fc.fileRead2list(sourceTxt, "utf-8");

int mid = lica7.size() / 2;

final List<String> lica7_half1 = lica7.subList(0, mid);

List<String> lica7_half2 = lica7.subList(mid, lica7.size());

new Thread>>>>

lica7_half1_result = ftc.fentsiMuilttheard(lica7_half1,

wordLibs, "thd1");

half1_isfinesh=true;

//main thread

//wait 4 half_thread_finish

//habin lyag list..









/////////////true code.











List<String> lica7_half1_result;

boolean half1_isfinesh=false;





/**

* @author attilax 1466519819@qq.com

* @param sourceTxt

* @param targetTxt

* @param wordLibs

*            for file line >5w bacause 50w time tooo long ,gujyi

*            1min...muset rewrite jeig swefa.

* @since cae

*/

public void fentsi4bigfile(String sourceTxt, String targetTxt,

final String wordLibs) {





// String wordLibs =

// "c:\\wordFromInputmethod.txt,c:\\word.txt,c:\\ext.txt";

// String sourceTxt = "c:\\sincin.txt";

// String targetTxt = "c:\\fentsiOK.txt";

int n = 0;

List<String> li_r = new ArrayList<String>();





fileC0 fc = new fileC0();

// String text = fc.fileRead(sourceTxt);

// if(true)return;

List<String> lica7 = fc.fileRead2list(sourceTxt, "utf-8");

int mid = lica7.size() / 2;

final List<String> lica7_half1 = lica7.subList(0, mid);

List<String> lica7_half2 = lica7.subList(mid, lica7.size());





List<String> lica7_half2_result;

// n = fentsiMuilttheard(wordLibs, n, lica7);





new Thread(new Runnable() {

public void run() {





try {

fentsiOr ftc = new fentsiOr();

lica7_half1_result = ftc.fentsiMuilttheard(lica7_half1,

wordLibs, "thd1");

half1_isfinesh=true;





} catch (Exception e) {

e.printStackTrace();

}

System.out.println(Thread.currentThread().getName());





}

}).start();







//main thread

fentsiOr ftc = new fentsiOr();

lica7_half2_result = ftc.fentsiMuilttheard(lica7_half2, wordLibs,

"thd_main");








//stop whiel half is not ok

int nn = 0;

while (true) {

if (half1_isfinesh) {

break;

}

nn++;

try {

Thread.sleep(50);

System.out.println("--sleep 500 ,num:" + nn);

} catch (InterruptedException e) {





e.printStackTrace();

throw new RuntimeException(e);

}





}





List<String> li_all=new ArrayList<String>();

li_all.addAll(lica7_half1_result);

li_all.addAll(lica7_half2_result);

 fc.saveList2file(li_all, targetTxt, "utf-8");





}

















参考:

多核编程 与 单核多线程编程的区别 - 点滴记录 不断进步 - 博客频道 - CSDN.NET.htm

paip.提升性能--多核cpu中的java/.net/php/c++编程的更多相关文章

  1. paip.提升性能--多核编程中的java .net php c++最佳实践 v2.0 cah

    paip.提升性能--多核编程中的java .net php c++最佳实践  v2.0 cah 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax ...

  2. paip.提升性能---mysql 优化cpu多核以及lan性能的关系.

    paip.提升性能---mysql 优化cpu多核以及lan性能的关系. 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http:/ ...

  3. paip.提升性能----java 无锁结构(CAS, Atomic, Threadlocal, volatile, 函数式编码, 不变对象)

    paip.提升性能----java 无锁结构(CAS, Atomic, Threadlocal, volatile, 函数式编码, 不变对象) 1     锁的缺点 2     CAS(Compare ...

  4. paip.提升性能---并行多核编程哈的数据结构list,set,map

    paip.提升性能---并行多核编程哈的数据结构list,set,map vector/copyonwritearraylist 都是线程安全的. 或者经过包装的list ::: collection ...

  5. paip.提升性能---jvm java 工具使用.

    paip.提升性能---jvm java 工具使用. 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn ...

  6. paip.提升性能---协程“微线程”的使用.

    paip.提升性能---协程的使用. 近乎无限并发的"微线程" 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:h ...

  7. paip. 提升性能---hibernate的缓存使用 总结

    paip. 提升性能---hibernate的缓存使用 总结 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog ...

  8. paip.提升性能----数据库连接池以及线程池以及对象池

    paip.提升性能----数据库连接池以及线程池以及对象池 目录:数据库连接池c3po,线程池ExecutorService:Jakartacommons-pool对象池 作者Attilax  艾龙, ...

  9. paip.提升性能3倍--使用栈跟VirtualAlloc代替堆的使用.

    paip.提升性能3倍--使用栈跟VirtualAlloc代替堆的使用. #----为什么要设计堆栈,它有什么独特的用途? 为了性能 ....  堆比栈的性能 也有的说法为了编程容易...这个是错误的 ...

随机推荐

  1. ubuntu 安装JAVA jdk的两种方法:

    ubuntu 安装jdk 的两种方式: 1:通过ppa(源) 方式安装. 2:通过官网下载安装包安装. 这里推荐第1种,因为可以通过 apt-get upgrade 方式方便获得jdk的升级 使用pp ...

  2. Oracle数据库备份 expdp/impdp导出导入命令

    使用EXPDP和IMPDP时应该注意的事项: EXP和IMP是客户端工具程序,它们既可以在客户端使用,也可以在服务端使用. EXPDP和IMPDP是服务端的工具程序,他们只能在ORACLE服务端使用, ...

  3. 自适应布局webkit-box的用法

    Flexible Box Model(灵活盒子模型)在平常的web横排布局中,会经常用到float或display:inline-block,但是在多种不同宽度的移动设备的自适应布局中用的话,还得设置 ...

  4. 【微信要跪】 iOS 应用如何完全支持 IPv6-ONLY 网络?

    var appInsights=window.appInsights||function(config){ function r(config){t[config]=function(){var i= ...

  5. Oracle case when的用法

    select xm,sex,(case sex when '男' then '1' when '女' then '2' end ) as xb, birthdayfrom student

  6. 领域模型驱动设计(Domain Driven Design)入门概述

    软件开发要干什么: 反映真实世界要自动化的业务流程 解决现实问题 领域Domain Domain特指软件关注的领域 在不能充分了解业务领域的情况下是不可能做出一个好的软件 领域建模 领域模型驱动设计 ...

  7. Linux:-bash: ***: command not found,系统很多命令都用不了

    系统:64位RHEL6 突然之间linux很多命令都用不了,均提示没有此命令. 这应该是系统环境变量出现了问题导致的. 出现这种可能性的原因有很多,大多数是因为,安装了新的软件要配置环境变量,但是没有 ...

  8. EDA技术与ASIC设计和FPGA开发有什么关系?FPGA在ASIC设计中有什么用途?

    利用EDA技术进行电子系统设计的最后目标是完成专用集成电路ASIC的设计和实现:FPGA和CPLD是实现这一途径的主流器件.FPGA和CPLD通常也被称为可编程专用IC,或可编程ASIC.FPGA和C ...

  9. 特征处理(Feature Processing)

    [本文链接:http://www.cnblogs.com/breezedeus/p/4109456.html,转载请注明出处] 我的博客主营地迁至github,欢迎朋友们有空去看看:http://br ...

  10. 百度地图API多个点聚合时,标注添加的标签label地图刷新就丢失的问题解决

    当将自定义的Marker(含有Label)通过MarkerClusterer 管理的时候,当地图发生任何移动.缩放 的时候,Marker 的Label 就会自动消失. 这个问题主要是由于百度的点聚合A ...