科学家有了钱以后,真是挺吓人的——D.E.Shaw的牛逼人生

黑科技,还是要提D.E.Shaw Research这个奇异的存在。

要讲这个黑科技,我们可能要扯远一点,先讲讲D.E. Shaw这个人是怎么学术赚钱通吃,成为彻底的人赢的

D.E.Shaw是个学霸,是PhD们的偶像:斯坦福大学计算机专业的博士, 30岁不到就进入哥伦比亚大学做教授,专门研究超大规模并行计算。这已经是优秀的学术人生了。

但是Shaw觉得无聊。哥伦比亚大学地处纽约,遍地暴发的对冲基金男各种花天酒地,游嬉于各种model之间,作为一个同样聪明的教授,却只能坐在冷板凳上写计算机model。虽然在科学家眼里,后者甚至还要更性感一些,但是时间长了也……扯远了,总之,Shaw不干了。

于是他1986年放弃了钻牛角尖的教授生涯,进入华尔街著名投行摩根斯坦利做quant trading(可以通俗地理解为用计算机自动炒股、债和外汇)。果然, 呆博士不是搞政治斗争的料子,在摩根斯坦利这种钱多是非多、政治斗争和技术斗争同样激烈的地方,仅仅2年之后他就在政治斗争中失败,被迫离开摩根斯坦利(欢迎quant trading方面的达人来八卦补全这一段故事)。但是这厮本来就不是池中物,同年,他就开办了自己的对冲基金D.E. Shaw & Co. LP.,专注quant trading,利用高速计算机网络和市场瞬间的有效性缺陷来进行高频统计套利。

和今天高频交易人满为患的情况不同:当时计算机很破,内存上兆的就是中型服务器了,计算机语言和组件也比较晦涩,不像今天这么普及和丰富,不会冒出来个12岁少年就能写一个网站编一个游戏,然后对着80后的老头子们说你们不行之类的。因此,能掌握高速网络编程和大型并行计算的人,除了能算弹道和模拟核爆之外,还能成为第一批做高频交易的人,干的事情基本就是无风险套利——利用市场无效性,剪市场的羊毛,赚钱的速度仅仅取决于你能剪多快。

作为专门研究超大规模并行计算的顶级专家的Shaw,率先杀入高频交易,完全是流氓会武术,谁也挡不住,剪羊毛速度世界一流,很快人生进入了新的高峰。到2015年,他的个人净值已经41亿美元(David Shaw - Forbes),杀入全球财富榜前500.

说了这么多,怎么还没有谈到计算化学?你别走,我现在就要说这事了。

David Shaw大叔40出头财务自由,依照常人的想法,自然可以不再写model,而一头扎进纽约的花天酒地,去约会真的model了。但是,正如网络上著名的牛顿生平文章《牛逼顿》所说:

出乎世俗想象的是,科学其实远比任何娘们儿都风骚,玩科学比玩女人爽得多,得到一个成果所获得的高潮强烈而持久,不仅有快感,更有巨大的自我认同感,远胜于那几秒寒颤之后无边的空虚与落寞。所以陈景润其实是沉溺于美色不能自拔,身体弱架不住高潮过度被爽死了。

Geek的基因在身体深处摇撼Shaw大爷功成名就之后的空虚神经。他一个回马枪杀回了科学世界,脱下西装,露出了Geek的本色:

和屌丝geek Sheldon不一样,这是一个破坏力惊人的土豪geek。Shaw现在再也不用跪舔NIH,NSF的官员,去讨一点可怜的科研经费了。他想干什么就干什么;他觉得什么是前沿什么就是前沿。他拿出大规模并行计算的大砍刀,想找一个最需要计算但现今最不给力的领域一刀砍下去。

这里有个背景:计算化学发展了很多年,都处在有点尴尬的位置,说得直白点——计算机还太弱,计算化学用于实际问题中算不准,精度还不如做实验。因此,无论在化学还是生物领域,做计算化学的不管是教授还是PhD,要么选择和实验的组合作,活在鄙视链的下游,要么躲到角落里小富即安地画圈圈。

因此,Shaw的大砍刀就落到了萎靡的计算化学上:他想制造一台专门用于做计算化学的超级计算机,比现有的超级计算机强大几千倍几万倍。

很多人可能要问,现在超级计算机动辄就是几十万个cpu核心什么的,运算能力很强大啊,为什么还要造计算化学的超级计算机呢?

答案是,一般的计算机是很聪明,但是不适合干计算化学这行。学术一点说,是general purpose computing不能高效地来做分子动力学模拟。

打个比方,现在的电脑就仿佛是个全能的机器人,你可以让他去割麦子,做饭,踢球等等。让他去干很多事情,他什么都能干,干得也比人快,确实也很聪明。这就是所谓的通用计算机(general purpose computing):一个机器,写不同的软件,实现各种功能。

但是在割麦子这件事情上,这个全能机器人的速度很难超越专业的大型联合收割机。因为大型联合收割机虽然笨,但是完全为割麦子而生,因此硬件上量身定制,极度优化。这就是所谓的特种计算机(special purpose computing):专业定制机器,软件也是专门定制的,只实现一个功能,但是凶残而高效。

Shaw就是要造一台计算化学中的“大型联合收割机”。这台收割机,叫做Anton。

它很贵很贵,但这正是Shaw的优势,反正他不泡妞不包二奶,钱花不完。况且,科研人员其实很便宜。

这里有一个好笑又辛酸的事情:和大众的认识恰好相反,在美国,纯理科博士毕业之后大多数都找不到工作,虽然智商大都不低,但是如果想坚持科研,做博士后的薪水只能勉强维持生活。

而David Shaw横空出世,成为了纽约的孟尝君。他招了一群找不到工作的博士——这些人在经济上可以说是纯粹的屌丝——开出了10万美元一年的工资。

10万美元一年是什么概念呢?这就是投资银行21、2岁小分析员的入门工资+奖金,在华尔街上就是底层,外面穿着西装,里面穿的可是开裆裤。但是对于这帮年届三十的科学屌丝来说,这是他们能找到研究岗位工资的2-3倍,是个做梦都想不到的包养价。

于是一时间最顶尖的计算化学、生物物理、电子工程博士趋之若鹜,求David Shaw包养。

从2004年前后开始(请知情人指正),Shaw成立的DE Shaw Research(DESRES)开始正式运营。在David Shaw的精心包养下,30多个失业的博士屌丝们什么也没干,在优雅的环境里,足足读了一年半的论文,搞出了Anton的草图。之后,更多的屌丝加入,全身心专注于Anton的研发。

2007年,比预期还早了快一年,来自五湖四海的屌丝和geek们发布了Anton的第一代。计算化学的最大黑科技诞生了:它比一般的超级计算机快约10,000倍。比最好的超算也快1,000倍。

对的。变态的10,000倍,四个零,四个数量级。

10000倍是什么意思呢?计算化学里面,模拟分子运动轨迹的持续时间的长短是非常重要的。用模拟网球比赛来做类比:以前“超级计算机”算了一个月,我们只能模拟出击球的1秒钟的瞬间,而现在Anton出世,我们同样花一个月,就可以模拟整场球赛中网球的轨迹了。

这是前所未有的超算能力,变态的“大型联合收割机”,等于开了上帝视角啊亲。


从2007年起,D.E. Shaw的团队声名鹊起,用这个收割机每年在国际顶尖的学术杂志《自然》和《科学》上灌水,学术声誉不可阻挡。Anton在手,高枕无忧,仿佛别人在地面用卷尺画地图,他们在天上航拍做地图。现在他们又出了Anton2,继续吊打“过去8年中取得了长足发展的”超级计算机。

也许纯学术派对这种硬拼计算能力的方法表示不屑,但D.E. Shaw和他包养的geek们正用变态的Anton计算机把分子动力学模拟大跨步地推向实用。

有钱就是任性。

以上文字来自知乎 @Zheng Sullivan , 原文链接:计算化学领域中有哪些技术可以被称为是当前的黑科技? - 知乎用户的回答 ( http://www.zhihu.com/question/30454088/answer/49284633 )

网站:
D. E. Shaw Research

-------------------科普结束--------------
关于Anton设计上的一些细节,参见doi: 10.1145/1273440.1250664。 关于Anton为什么能算这么快的一些细节,全部在下面这几段话里,总结一下就是:整个MD simulation的硬件计算被拆分成了硬件直接计算和可编程计算两部分,两者都是硬件实现的,速度比软件实现要快万倍。各个node之间通讯也是特殊设计的超高速低延迟网络,不是一般的网络。

To simulate a millisecond within a couple of months, we must complete a time step every few microseconds, or every few thousand clock ticks. The sequential dependence of successive time steps in an MD simulation makes speculation across time steps extremely difficult. Fortunately, specialization offers unique opportunities to accelerate an individual time step using a combination of architectural features that reduce both computational latency and communication latency.

For example, we reduced computational latency by designing:

  • Dedicated, specialized hardware datapaths and control logic to evaluate the range-limited interactions and to perform charge spreading and force interpolation. In addition to packing much more computational logic on a chip than is typical of general-purpose architectures, these pipelines use customized precision for each operation.
  • Specialized, yet programmable, processors to compute bond forces and the FFT and to perform integration. The instruction set architecture (ISA) of these processors is tailored to the calculations they perform. Their programmability provides flexibility to accommodate various force fields and integration algorithms.
  • Dedicated support in the memory subsystem to accumulate forces for each particle.

We reduced communication latency by designing:

    • A low-latency, high-bandwidth network, both within an ASIC and between ASICs, that includes specialized routing support for common MD communication patterns such as multicast and compressed transfers of sparse data structures.
    • Support for choreographed “push”-based communication. Producers send results to consumers without the consumers having to request the data beforehand.
    • A set of autonomous direct memory access (DMA) engines that offload communication tasks from the computational units, allowing greater overlap of communication and computation. l Admission control features that prioritize packets carrying certain algorithm-specific data types.

科学家有了钱以后,真是挺吓人的——D.E.Shaw的牛逼人生的更多相关文章

  1. 我对git 、github的初印象

    前言:都说,要在IT这行混得风生水起,就必须不断接触新事物.学习新东西.然而,这个重要的点也是难做的点.当老师要我们用博客交作业的时候,我就觉得挺新鲜了,在知道很多牛逼的程序猿还会用到git和gith ...

  2. 淘宝RubyGems和NPM镜像的使用

    题记:前不久在windows下配置jekyll环境时,需要用到gem,一个ruby的管理包,类似于管理nodejs包的npm.安装ruby环境后,使用gem安装包时请求国外的[https://ruby ...

  3. 渣渣菜鸡为什么要看 ElasticSearch 源码?

    前提 人工智能.大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需,大型企业早已淹没在系统生成的浩瀚数据流当中.大数据技术业已集中在如何存储和处理这些海量的数据上.Elast ...

  4. 那些跟钱有关的事儿 z

    这是两段朴实的创业笔记,作者是王信文,2009年南京大学本科毕业,2009年9月到2013年3月在腾讯上海的互动娱乐部门工作,2013年3月到现在和几个前同事一起创立了莉莉丝游戏(手游刀塔传奇是他们后 ...

  5. 创业成本?亲身经历告诉你做一个app要多少钱

    导语:作为一名苦逼的移动互联网创业者,被外行的朋友们问及最多的问题是“做一个网站需要多少钱?”或者“做一个APP需要多少钱?” 作为一名苦逼的移动互联网创业者,被外行的朋友们问及最多的问题是“做一个网 ...

  6. zhihu spark集群,书籍,论文

    spark集群中的节点可以只处理自身独立数据库里的数据,然后汇总吗? 修改 我将spark搭建在两台机器上,其中一台既是master又是slave,另一台是slave,两台机器上均装有独立的mongo ...

  7. 罗永浩专访全文记录(转自好奇心日报-http://www.qdaily.com/)

    这篇文章是转的,存档做记录,定期看一看,激励自己遇到到困难时,想想人家比自己难多了,自己那点事算个屁啊.学习别人,不要带有傻逼主观倾向性,这样什么也得不到,我看完后,发现有一句话,说的非常好,自己有自 ...

  8. 我YY的一个移动应用运营模式

    尽管自己也还是刚刚毕业不久的前端新人,但网上也不乏一些案例告诉我们有志不在年高,很多优秀的同龄人已经有了不错的成就,所以在切页面写onclick之余也在进行一些思考,前端程序员的出路到底在哪里? 一. ...

  9. 我的这10年——从机械绘图 到 炼油 到 微软MVP 的华丽转身

    年底了,各种总结计划满天飞,有空的时候我也一直在思考这么多年,是怎么过来的.也曾经很迷茫,希望经验和经历能给大家一点带来一点正能量的东西.10年很长,10年前说实话我没有思考过现在的样子,但10年前的 ...

随机推荐

  1. angularJS通过post方法下载excel文件

    最近工作中遇到,要使用angularJS的post方法来下载excel的情况.网上找到一个帖子:http://stackoverflow.com/questions/22447952/angularj ...

  2. 年薪10W和100w的人差距在哪?

    12年前,我直升了硕士,在家闲得慌,去一家香港的婴幼儿杂志全职实习,每天早上8点上班,下午5点下班,一个月我负责20p左右的内容,实习工资800元. 公司很小,没有办公室政治,大家都很松散,上班打打游 ...

  3. 计算系数 (codevs 1137) 题解

    [问题描述] 给定一个多项式(ax + by)^k,给定a.b.k.n.m,请求出多项式展开后x^n y^m项的系数. [样例输入] 1 1 3 1 2 [样例输出] 3 [解题思路] 本题为NOIP ...

  4. 关于fseek和文件"ab+"打开方式的问题

    这是在写一个文件的的时候发生的一个错误,代码如下 #include<stdio.h> #include <errno.h> #include <string.h> ...

  5. arm 基本

    ARMr0-r4 传递参数与返回值r7 帧指针 指向母函数被调用子函数在栈看中的交界栈帧指针(Frame Pointer).指向前一个保存的栈帧(stack frame)和链接寄存器(link reg ...

  6. TETRIS 项目开发笔记

    java学习一个月了,没有什么进展,期间又是复习Linux,又是看Android,瞻前顾后,感觉自己真的是贪得无厌, 学习的东西广而不精,所以写出的文章也就只能泛泛而谈.五一小长假,哪里都没有去,也不 ...

  7. 记录:asp.net mvc 中 使用 jquery 实现html5 实现placeholder 密码框 提示兼容password IE6

    @{ViewBag.Title = "完美结合";} <script>var G_start_time = new Date;</script> <! ...

  8. sk_buff

    在2.6.24之后这个结构体有了较大的变化,此处先说一说2.6.16版本的sk_buff,以及解释一些问题. 一. 先直观的看一下这个结构体~~~~~~~~~~~~~~~~~~~~~~在下面解释每个字 ...

  9. ubuntu 安装cloudera hadoop

    参考:http://www.aboutyun.com/thread-8921-1-1.html auto wlan0iface wlan0 inet staticaddress 10.32.37.12 ...

  10. 通过store为toolbar添加按钮

    目的是实现导航条toolbar可以动态加载按钮. ExtJS的版本是4.0. 实现方案有两个.方案一:添加render事件监听,在监听事件处理函数中使用Ext.Ajax获取按钮信息,实现动态添加按钮. ...