解决的问题

　　　　　　文件总量太大一台服务器无法存放只能放在网络集群中分节点存放也就是通过屏蔽网络部分形成一个“ one big CPU” 和 “one big disk” 。Client只需要向这个CPU去做read/write/mofity操作即可。但是对于业务的不同，也无法去满足满足通性，根据业务的不同设计不同的系统效率比较高【个人见解】

TFS个人理解

　　　　　　　因为在gfs的架构影响后面的分布式系统的设计中心节点和从节点因为在做存储文件这块 gfs能够承受google业务所以对于一般公司只要按照这种架构设计和实现好应该都能很好满足业务需求。

现在看看具体的TFS。先看下一个业务需求：有200亿图片要存入到一个系统中，系统能够很快的定为出来图片文件在哪里，并且可以支持读写操作。图片元信息假设64字节，200亿*64>1Tb 这个元信息都可以把一个主机磁盘塞爆，另外如果即时元信息放进去了 metadata不能把所有文件目录下的数据都缓存到内存中，查询很可能导致了要读3次磁盘，这点效率很低。看看TFS如何设计的：

文件系统所具备的基本信息

　　　　　　　　要通过一个文件系统寻找到相应的文件需要知道文件的目录【延伸到文件在哪里】以及文件大小【要读多少个块】，OS才能从这个系统中读取出来。

核心机制　　

　　　　多个小文件共用一个物理文件。也就是通过调控这个物理文件大小可以单台机子可以存放所有小文件的meta信息使得这个不在成为瓶颈。所以得讨论出具体的TFS怎么做到这个共用？

　　　物理文件我定义成Block 1~Block n. 大小为M兆。

　　　图片文件名为picname,大小为pKB.TFS唯一64位编号为id.

　　　 tfs客户端通过请求NameServer写入一个小文件picname,NameServer分配一个TFS“内部文件名路径”给客户端，他就是指引你应该在哪里写文件。其实就一个文件名编码工作：

　　　　含有block id和file sequence id。核心东东，其实在master里维护的都是meta information。这样master通过调控block大小来调控整个TFS集群所能支持的一个文件数量。屏蔽内部写的情况，如果TFS写入成功，这个返回出来的这个信息要和一般的文件对应呢？需要有一个数据库记录这2者之间的关系。所以说还得要有数据库来记录这些文件所在的位置。kv系统在合适不过。

　　　　现在来看看我们的master里存储了啥：现在对于master而言就是一个一个block信息块，可以map<blockid,metea>来存储查找元信息。这样master的内存不足部分解决了。对于client无论是读还是写都要都只要请求master的block id和offset。如果客户端缓存的话，就直接去相应的DataServer找。所以呢这点设计还是非常好。

　　　　读过程就非常明显了：tfs_file ----------->block_id---->meta信息----> block id和file offset 去找到相应的文件位置然后读出来。这样读性能应该还是比较高的。

　　　　现在来看看写过程：

　　　　　　有几个点：写操作对于tfs而言所一个单线程模型结构，所有的写操作都会排队一个接着一个的写，不能并发写。这样设计他应该是认为写毕竟是少数时候而多数时候都是读所以慢没有很大的影响。实现起来会比较方便。这里的DataServer(master)就用于和nameserver交流控制信息。Nameserver交互比较多，会拖慢nameserver速度。然后复制的时候的策略就是master和dataserver replication。等所有步骤都完成了才会向客户端发送写成功。中间一个操作挂了就重新写。代价还是蛮高的。

TFS容错机制容灾扩容

　　　　一个集群机里如果DATAserver容量不够了自动扩容按理来说也是非常合理的事情，同样一台主机节点挂了，他的复制品按理来说应该会把内容写入到其他的主机上，通过master的寻找自动处理这种机制。这些内容是靠maseter来做的，同样master和备用master应该是同一复制品。master挂了也可以自动切换。这点还是非常重要的，但比较简单，有一点主master和备用master应该采用同步机制，不然可能出现不一致性现象。

　　　　　　master按理来说要维护dataserver所有的心跳信息，如果没有在指定的时间发回信息，我们怎么办？启用数据迁移机制，所以说为了寻找这个主机的block id，应该维护这样的map<dataserver,block_id>的操作吧，寻找起来会快速很多！然后根据新的整体信息每个节点的信息和容量来决定分配新的DataServer。

　　　　　　如果整个TFS集群挂了应该采用双写双机房更安全，不过会比较烧钱吧嘿嘿！

另外的点　　　　

　　另外1：数据而言，有可能读取非常不均匀，多数客户端同时请求读同一个block_id怎么办？其实缓存还是必须得做的，我指得是文件缓存，这样可以减低了效率，当然本身数据就没有任何的冷热点，那样为了维护缓存会耗费的更多时间，应用数据应该都具有一定的冷热性吧。嘿嘿只要不要突然请入了很多无关数据把缓存池被污染了那就比较麻烦了那是缓存以后有机会在讨论这些问题。

　　　2: 读一个64M的文件的某个offset起的n个byte，这个问题其实对TFS读应该是一个比较大的性能损失，要调用lseek() 然后read（）或者直接全部read到内存里[那更不可靠呀]。如果能很好的解决这个问题 read性能还是很高的。不知道tfs是怎么做这点的以后可以好好看看源码研究下。

　OVER了

分布式blog系统 TFS总结的更多相关文章

分布式消息系统Kafka初步
终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到.从这一篇开始分布式消息系统的入门. 在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到 ...
KAFKA分布式消息系统[转]
KAFKA分布式消息系统转自:http://blog.chinaunix.net/uid-20196318-id-2420884.html Kafka[1]是linkedin用于日志处理的分布式消 ...
Memcached 分布式缓存系统部署与调试
Memcache 分布式缓存系统部署与调试工作机制:通过在内存中开辟一块区域来维持一个大的hash表来加快页面访问速度,和数据库是独立的;目前主要用来缓存数据库的数据;存放在内存的数据通过LRU算法 ...
分布式消息系统Jafka入门指南之二
分布式消息系统Jafka入门指南之二作者:chszs,转载需注明.博客主页:http://blog.csdn.net/chszs 三.Jafka的文件夹结构 1.安装tree命令 $ sudo yu ...
一篇文章让你深透理解cookie和session，附带分布式WEB系统redis共享session方案
cookie和session有什么区别?这是一个很基础的知识点,大家可能都知道一个大概:cookie是存在客户端的,session是存储在服务端,cookie和session用来验证识别用户的登录状态 ...
一种开源的分布式消息系统Nats
一种开源的分布式消息系统Nats 作者:chszs.未经博主同意不得转载.经许可的转载需注明作者和博客主页:http://blog.csdn.net/chszs 1.NATS介绍 NATS是一个开源的 ...
Spring Cloud 5分钟搭建教程(附上一个分布式日志系统项目作为参考) - 推荐
http://blog.csdn.net/lc0817/article/details/53266212/ https://github.com/leoChaoGlut/log-sys 上面是我基于S ...
分布式消息系统Kafka初步（一）（赞）
终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到.从这一篇开始分布式消息系统的入门. 在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到 ...
分布式机器学习系统笔记（一）——模型并行，数据并行，参数平均，ASGD
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 技术交流QQ群:433250724,欢迎对算法.技术.应用感兴趣的同学加入. 文章索引::"机器学 ...

随机推荐

CSS网页布局全精通
在本文中将使用四种常见的做法,结合CSS于结构化标记语法制作两栏布局.很快地就会发现,不用嵌套表格,间隔用的GIF也能做出分栏版面布局. 相关文章:CSS网页布局开发小技巧24则稍后在"技 ...
jquery ajax跨域调用
客户端: //ajax跨域调用的方法 $.ajax({ url:dustUrl+"/screenshot/getDevices.do", type: "get" ...
mysql-front导出数据库字典
直接导出HTML,然后打开HTML最后直接复制到word就可以了!!!之前一直在找navicat如何导出数据字典.现在发现就是这样就可以了!
Java集合类学习笔记（各种线性表性能分析）
ArrayList.LinkedList是线性表的两种典型实现:基于数组的线性表和基于链的线性表. Queue代表了队列,Deque代表了双端队列. 一般来说,由于数组以一块连续内存区来保存所有的数组 ...
HDU 4951 Multiplication table(2014 Multi-University Training Contest 8)
思路如果进制为p 那么当x<p时 (p-1)*(p-x)=(p-(x+1)) *p +x 因为x<p 所以没有进位所以高位上的数字为 p-(x+1). 根 ...
Bootstrap <基础三十一>插件概览
在前面布局组件中所讨论到的组件仅仅是个开始.Bootstrap 自带 12 种 jQuery 插件,扩展了功能,可以给站点添加更多的互动.即使不是一名高级的 JavaScript 开发人员,也可以着手 ...
http调接口
private static String doGetResult(String urlStr, Map<String, String> params) throws Exception ...
观点：BPM已经过时了？
在这个信息爆炸的世界,业务转型通常是以数字系统和流程的方式发生. 根据Forrester的报告“软件必须丰富你的品牌”,人们要依靠这些技术实现期望的商业成果,比如品牌联系.客户服务创新.更好的产品和提 ...
JavaScript 闭包系列一
一. 闭包的概念闭包是有权访问另一个函数作用域中的变量的函数. 如下代码:根据变量作用域,函数outer中所有的局部变量对函数inner都是可见的.但是反过来不行,inner内部的局部变量对oute ...
C++自学计划
课程描述课程名称:C++远征之起航篇&C++远征之离港篇授课人姓名:james_yuan 课程链接地址 C++远征之起航篇 C++远征之离港篇章节列表选择理由一开始在自己比较熟悉的网 ...

分布式blog系统 TFS总结

解决的问题

文件系统所具备的基本信息

核心机制

分布式blog系统 TFS总结的更多相关文章

随机推荐

热门专题

核心机制