CPU|MICGPU|FPGA|超算|Meta-data|

生物医学大数据：

收集数据后对数据的分析，如同看相，而对数据信息的挖掘可以看作是算命。这两个过程是基于算法和软件这类工具之上的。

在存储方面：在硬件上，为了Parallel computing的目的，刚开始选择的处理器是multiple core，之后选择many integrated core architecture（MIC：英特尔® 集成众核架构（英特尔® MIC 架构）产品为开发人员提供了一个关键优势：它们基于标准的现有编程工具和方法运行），之后选择GPU（大内存），之后是FPGA（电场可编程逻辑闸阵列，它是在PAL、GAL、CPLD等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的，既解决了全定制电路的不足，又克服了原有可编程逻辑器件门电路数有限的缺点。但是就生物信息学领域只能跑GATK），如今又有了超级计算机。

No free lunch：由CPU到超算，灵活性下降但是专有性上升，同时存在的问题是费用变高。现如今的生物信息学分析，正在使用更为专有性的硬件，也更加费钱。

因此，面临Massive data和由于data transfer造成的cost，可以有以下基于软件的应对方法：

1.尽可能传输压缩包

2.decouple：将原始数据分析拆解，选择有需要的类型，会减少数据量

3.使用dataset保存分析结果：因为生物数据的特点是a.快速增长b.异构c.一次读多次写,所以以数据特征作为研究对象更为重要，将这些数据特征存入数据库更可以方便查找。

4.去冗余：将原始数据中重复部分去掉。

对于Data的处理过程中，需要注意：

1.要对数据进行Analysis，mining（即是prediction），visual。其中，Data mining这个过程是：首先先能够建立scientific model，这个model是一种grey box，它有别于white box或者black box。white box是研究现象的本质，black box是由现象1指向现象2，它们其中是没有过程的，即不知道为什么；而grey box是通过statistical定量得到的，是利用统计学将不确定是否发生的概率数据化，将预测变成可以度量的数字。因为统计学是将现象1和现象2用数学公式联系在一起，其中数公式反应的是两者的关联强度，并对这个关联强度定量，所以人们利用这个定量值make decision，这个decision可以是判定这些原始数据与某patterns关联很大（或反应了某pattern），据此有一个结论，就是“是or不是某pattern”，根据这个结论，科学家可以找到new knowledge。

2.明白Meta-data（元数据，又称诠释数据、中介数据、中继数据、后设数据等，为描述其他数据信息的数据。）与raw-data之间的关系，因为生物信息学数据有一次读多次写（或者多次分析）的特点，所以应该分离读写。

3.同时面临越来越多的数据必须要扩大内存。

CPU|MICGPU|FPGA|超算|Meta-data|的更多相关文章

【记】研究Sharding-JDBC遇到的一个异常(Caused by: io.shardingsphere.core.exception.ShardingException: Cannot get uniformed table structure for `t`. The different meta data of actual tables are as follows)
一.异常信息 Caused by: io.shardingsphere.core.exception.ShardingException: Cannot get uniformed table str ...
GPU、CPU、FPGA
一.计算核心增加二者都由寄存器.控制器.逻辑单元构成,但比例很大不同,决定了CPU擅长指令处理,函数调用上:GPU在数据处理(算数运算/逻辑运算)强力很多. NIVIDA基于Maxwell构架的GP ...
A JavaScript library for reading EXIF meta data from image files.
exif-js/exif-js: JavaScript library for reading EXIF image metadata https://github.com/exif-js/exif- ...
《BI那点儿事》META DATA（元数据）
关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据.同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理.为数据仓库的发展 ...
Facebook图片存储系统Haystack——存小文件，本质上是将多个小文件合并为一个大文件来降低io次数，meta data里存偏移量
转自:http://yanyiwu.com/work/2015/01/04/Haystack.html 一篇14页的论文Facebook-Haystack, 看完之后我的印象里就四句话: 因为[传统文 ...
国内首款 FPGA 云服务器，性能是通用 CPU 服务器 30 倍以上
版权声明:本文由薛梁原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/628340001485134638 来源:腾云阁 ht ...
FPGA能代替CPU架构吗？
你还没听过FPGA?那你一定是好久没有更新自己在企业级IT领域的知识了.今天笔者就和大家聊聊何为FPGA?FPGA主要应用场景是什么?有人说FPGA是替代传统CPU和GPU的未来,你信吗? FPGA全 ...
OpenTSDB-Writing Data
Writing Data You may want to jump right in and start throwing data into your TSD, but to really take ...
简单cpu web flask mysql
转:http://blog.csdn.net/u010663768/article/details/60632133 python 2.7 cpu入库 #!/usr/bin/python # -*- ...

随机推荐

操作实践，git本地分支执行rebase,让主干分支记录更简洁
声明:迁移自本人CSDN博客https://blog.csdn.net/u013365635 我们平时在写代码的时候,难免会修修改改,如果团队中每个人的代码提交记录都包含着一堆中间过程,是很不利于团队 ...
Problem for Nazar CodeForces - 1151C （前缀和）
Problem for Nazar Nazar, a student of the scientific lyceum of the Kingdom of Kremland, is known for ...
UML-如何进行面向对象设计？
1.开发者如何设计对象? 1).直接编码 2).uml图,然后编码 3).uml图,不编码绘图要轻量的 2.并行创建若干模型如:5分钟画交互图,5分钟画类图.反复交替 3.选择什么样的UML CA ...
题解 P6005 【[USACO20JAN]Time is Mooney G】
抢第一篇题解这题的思路其实就是一个非常简单的dijkstra,如果跑到第一个点的数据不能更新的时候就输出很多人不知道要跑多少次才停.其实这题因为答案要减去 T*c^2,而每条边的值 <= 1 ...
Tensorflow学习教程------tfrecords数据格式生成与读取
首先是生成tfrecords格式的数据,具体代码如下: #coding:utf-8 import os import tensorflow as tf from PIL import Image cw ...
脚本kafka-configs.sh用法解析
引用博客来自李志涛:https://www.cnblogs.com/lizherui/p/12275193.html 前言介绍网络上针对脚本kafka-configs.sh用法,也有一些各种文章,但 ...
用JS打开新窗口，防止被浏览器阻止的方法
相信做web前端或者使用JS的朋友都会遇到需要在新窗口打开页面的情况,现在浏览器大都具有弹出窗口拦截功能,所以传统的window.open()不再那么好用了.借鉴于网上查到的方法和我个人的实践,把弹出 ...
iOS 添加view的分类(更加方便的设置view的位置)
点击创建UIView的分类category,这里命名为 PLExtension(为了和下面对应) view分类.h文件 #import <UIKit/UIKit.h> @interface ...
Java任务调度框架之分布式调度框架XXL-Job介绍
Java任务调度框架之分布式调度框架XXL-Job介绍及快速入门调度器使用场景: Java开发中经常会使用到定时任务:比如每月1号凌晨生成上个月的账单.比如每天凌晨1点对上一天的数据进行对账操作 ...
VirtualBox虚拟机安装
目录安装前准备 1.开始安装,安装很简单,直接上图 2.设置全局路径,这里主要是方便以后创建虚拟机的时候不用每次都去选择存放位置,默认是存放到C盘安装前准备系统:Windows 10 专业版软 ...

CPU|MICGPU|FPGA|超算|Meta-data|

CPU|MICGPU|FPGA|超算|Meta-data|的更多相关文章

随机推荐

热门专题