参考

官方网站:https://github.com/happyfish100/

配置文档:https://github.com/happyfish100/fastdfs/wiki/

参考资料:https://www.oschina.net/question/tag/fastdfs

Java客户端:https://github.com/happyfish100/fastdfs-client-java

术语

fastDFS:

FastDFS是一款开源的轻量级分布式文件系统纯C实现,支持Linux、FreeBSD等UNIX系统类google FS,不是通用的文件系统,只能通过专有API访问,目前提供了C、Java和PHP API为互联网应用量身定做,解决大容量文件存储问题,追求高性能和高扩展性FastDFS可以看做是基于文件的key value pair存储系统,称作分布式文件存储服务更为合适。
------ 来自官网介绍

tracker-server:

跟踪服务器, 主要做调度工作, 起负载均衡的作用。 在内存中记录集群中所有存储组和存储服务器的状态信息, 是客户端和数据服务器交互的枢纽。 相比GFS中的master更为精简, 不记录文件索引信息, 占用的内存量很少。

storage-server:

存储服务器( 又称:存储节点或数据服务器) , 文件和文件属性( metadata) 都保存到存储服务器上。 Storage server直接利用OS的文件系统调用管理文件。

group:

组, 也可称为卷。 同组内服务器上的文件是完全相同的 ,同一组内的storage server之间是对等的, 文件上传、 删除等操作可以在任意一台storage server上进行 。

meta data:

meta data:文件相关属性,键值对( Key Value Pair) 方式,如:width=1024,heigth=768 。

单机文件系统的对比

文件系统 高可用 扩展 部署复杂程度 性能
单机文件系统 低,依赖于单机服务器,只要服务器崩溃,完全不可用。 低,要扩容只能停机增加硬盘。 当文件数量多到一定的程度,磁盘IO寻址操作将会成为瓶颈
分布式文件系统 高,一个group内的服务器崩溃后,group内的其他storage将接管服务。 高,可以不停机增加group机器。 高,部署较复杂 高,通过集群或者分布式的方式分担服务器的压力。

其他文件系统的对比

指标 适合类型 文件分布 系统性能 复杂度 FUSE POSIX 备份机制 通讯协议接口 社区支持 开发语言
FastDFS 4KB~500MB 小文件合并存储不分片处理 很高 简单 不支持 不支持 组内冗余备份 Api HTTP 国内用户群 C语言
TFS 所有文件 小文件合并,以block组织分片   复杂 不支持   Block存储多份,主辅灾备 API http C++
MFS 大于64K 分片存储 Master占内存多   支持 支持 多点备份动态冗余 使用fuse挂在 较多 Perl
HDFS 大文件 大文件分片分块存储   简单 支持 支持 多副本 原生api 较多 Java
Ceph 对象文件块 OSD一主多从   复杂 支持 支持 多副本 原生api 较少 C++
MogileFS 海量小图片   复杂 可以支持 不支持 动态冗余 原生api 文档少 Perl
ClusterFS 大文件     简单 支持 支持     C

适用场景:

特别适合以中小文件( 建议范围: 4KB 到 500MB ) 为载体的在线服务, 如相册网站、 视频网站等等。

部署结构

fastdfs文件系统.png

适合本公司的最小化部署图

fastdfs文件系统1 (1).png

192.168.1.177安装fastdfs的tracker节点,以及nginx反向代理服务器用于下载服务。

192.168.1.188,192.168.1.189安装fastdfs的storage节点,默认分一组,一组内两台机器互为备份.

注意:为了做到高可用,一个group建议分为两台以上的机器。

tracker安装(192.168.1.177)

  • 安装 libfastcommon、perl依赖,下载libfastcommon-master.zip,上传到服务器的/usr目录下。
    https://github.com/happyfish100/libfastcommon

      [root@localhost usr]# unzip libfastcommon-master.zip
    [root@localhost usr]# cd libfastcommon-master
    [root@localhost usr]# ./make.sh
    [root@localhost usr]# ./make.sh install
    [root@localhost usr]# yum install perl
  • 编译安装fastdfs

      [root@localhost usr] # tar -zxvf fastdfs-5.08.tar.gz
    [root@localhost usr] # cd fastdfs-5.08
    [root@localhost fastdfs-5.08] # ./make.sh
    [root@localhost fastdfs-5.08] # ./make.sh install
    [root@localhost fastdfs-5.08]# ./make.sh install
    mkdir -p /usr/bin
    mkdir -p /etc/fdfs
    cp -f fdfs_trackerd /usr/bin
    if [ ! -f /etc/fdfs/tracker.conf.sample ]; then cp -f ../conf/tracker.conf /etc/fdfs/tracker.conf.sample; fi
    mkdir -p /usr/bin
    mkdir -p /etc/fdfs
    cp -f fdfs_storaged /usr/bin
    if [ ! -f /etc/fdfs/storage.conf.sample ]; then cp -f ../conf/storage.conf /etc/fdfs/storage.conf.sample; fi
    mkdir -p /usr/bin
    mkdir -p /etc/fdfs
    mkdir -p /usr/lib64
    mkdir -p /usr/lib
    cp -f fdfs_monitor fdfs_test fdfs_test1 fdfs_crc32 fdfs_upload_file fdfs_download_file fdfs_delete_file fdfs_file_info fdfs_appender_test fdfs_appender_test1 fdfs_append_file fdfs_upload_appender /usr/bin
    if [ 0 -eq 1 ]; then cp -f libfdfsclient.a /usr/lib64; cp -f libfdfsclient.a /usr/lib/;fi
    if [ 1 -eq 1 ]; then cp -f libfdfsclient.so /usr/lib64; cp -f libfdfsclient.so /usr/lib/;fi
    mkdir -p /usr/include/fastdfs
    cp -f ../common/fdfs_define.h ../common/fdfs_global.h ../common/mime_file_parser.h ../common/fdfs_http_shared.h ../tracker/tracker_types.h ../tracker/tracker_proto.h ../tracker/fdfs_shared_func.h ../storage/trunk_mgr/trunk_shared.h tracker_client.h storage_client.h storage_client1.h client_func.h client_global.h fdfs_client.h /usr/include/fastdfs
    if [ ! -f /etc/fdfs/client.conf.sample ]; then cp -f ../conf/client.conf /etc/fdfs/client.conf.sample; fi

如出现以上信息,说明安装成功。

fastDFS命令目录:/usr/bin

fastDFS配置文件目录:/etc/fdfs

  • 创建fastdfs数据目录

      mkdir -pv /data/fastdfs/tracker
  • 修改tracker.conf中的 base_path=/data/fastdfs/tracker,即刚才配置的数据文件目录

     cp etc/fdfs/tracker.conf.sample etc/fdfs/tracker.conf
    vi etc/fdfs/tracker.conf
  • 启动FASTDFS

      cd  /usr/bin
    fdfs_trackerd /etc/fdfs/tracker.conf restart
  • 验证,默认端口是22122

      [root@localhost bin]# netstat -antp|grep trackerd
    tcp 0 0 0.0.0.0:22122 0.0.0.0:* LISTEN 31046/fdfs_trackerd

storage安装(192.168.1.188,192.168.1.189)

storage的安装与tracker安装类似,首先编译安装fastdfs,然后修改配置文件。

  • 创建配置文件

      cp etc/fdfs/storage.conf.sample etc/fdfs/storage.conf
    vi etc/fdfs/storage.conf
  • 修改tracker.conf中的

      disabled=false #启用配置文件
    group_name=group1 #组名,根据实际情况修改
    port=23000 #设置 storage 的端口号
    base_path=/data/fastdfs/storage #设置 storage 的日志目录(需预先创建)
    store_path_count=1 #存储路径个数,需要和 store_path 个数匹配
    store_path0=/data/fastdfs/storage #存储路径
    tracker_server=192.168.1.177:22122 #tracker 服务器的 IP 地址和端口号
  • 启动

      cd /usr/bin
    ./fdfs_storaged /etc/fdfs/storage.conf restart

java client

Javaclient的jar包不在maven的中央仓库中,需要下载源码包手工安装到私服中。

下载地址:https://github.com/happyfish100/fastdfs-client-java

我们主要关注storageclient这个类,这个类提供了文件上传下载查询文件信息等主要功能,与系统的集成也主要使用这个api。

Paste_Image.png
  • 新建fastDFS.conf配置文件

      connect_timeout = 2
    network_timeout = 20
    #tracker服务器地址,如果有多个tracker可以配置多个tracker_server
    tracker_server=192.168.1.177:22122
  • 运行源码包中的org.csource.fastdfs.test.testClient.java,注意在main方法中需要传递两个参数,第一个是配置文件,第二个是待上传的文件

    Paste_Image.png
  • 测试结果,已经能够通过Javaclient上传下载文件,但是通过http的方式下载还有问题。

    Paste_Image.png

在storage节点上安装nginx,增加http下载支持

  • 编译安装nginx,下载prce、zlib、fastdfs-nginx-module依赖支持,上传到storage的usr/local/src目录下。fastdfs-nginx-module主要用于解决同一组内文件同步不及时的问题。

    Paste_Image.png
  • 解压缩

      cd  /usr/local/src
    unzip ./zlib-master.zip
    tar -xvf ./nginx-1.11.7.tar.gz
    unzip ./pcre-8.38.zip
    cd ./nginx-1.11.7
    ./configure --prefix=/usr/local/nginx --add-module=/usr/local/src/fastdfs-nginx-module-master/src --with-pcre=/usr/local/src/pcre-8.38 --with-zlib=/usr/local/src/zlib-master
    make && make install
    cp ../fastdfs-nginx-module-master/src/mod_fastdfs.conf /etc/fdfs/
  • 修改nginx.conf

       server {
    listen 80;
    server_name localhost;
    location ~ /group1/M00{
    root /data/fastdfs/storage;
    ngx_fastdfs_module;
    }
    }
  • 配置mod_fastdfs.conf

      #保存日志目录
    base_path=/data/fastdfs/storage
    #tracker 服务器的 IP 地址以及端口号 storage_server_port=23000 #storage 服务器的端口号
    tracker_server=192.168.1.177:22122
    #当前服务器的 group 名
    group_name=group1
    #文件 url 中是否有 group 名
    url_have_group_name = true
    #存储路径个数,需要和 store_path 个数匹配 store_path0=/data/fastdfs/storage #存储路径
    store_path_count=1
    # 从文件 扩展 名查 找 文件 类型 ( nginx 时 为true) group_count = 2#设置组的个数
    http.need_find_content_type=true [group1]
    group_name=group1
    storage_server_port=23000
    store_path_count=1
    store_path0=/data/fastdfs/storage

安装nginx反向代理服务器(192.168.1.177)

  • 安装nginx,安装过程参考上一步

  • 配置nginx.conf

      upstream fdfs_group1 {
    server 192.168.1.188 weight=1 max_fails=2 fail_timeout=30s;
    #server 192.168.1.189 weight=1 max_fails=2 fail_timeout=30s;
    }
    server {
    listen 80;
    server_name localhost;
    location /group1/M00 {
    proxy_next_upstream http_502 http_504 error timeout invalid_header;
    proxy_pass http://fdfs_group1;
    expires 30d;
    }
    #其他配置
    }
  • 再次使用Javaclient测试

    Paste_Image.png
    Paste_Image.png

其他深入主题

  • nginx反向代理服务器的缓存优化
  • 扩容方案
  • tracker节点的集群优化

作者:哥别打脸
链接:https://www.jianshu.com/p/1c71ae024e5e
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

fastdfs(https://www.jianshu.com/p/1c71ae024e5e)的更多相关文章

  1. [转]https://www.jianshu.com/p/06443248f4d8

    eos是什么? 原文 https://www.jianshu.com/p/06443248f4d8 简介 用一句话来定义eos,即:区块链操作系统,支持在它之上构建dapp,支持智能合约.帐户.身份验 ...

  2. Zabbix调优不完全指南(https://www.jianshu.com/p/2d911d55448f)

    从学习搭建zabbix到完成各类监控.调优.二次开发已经过去了两年,期间通过QQ学习群.zabbix官方社区.各个技术博客整理学习了不少关于各种报错的处理方法,现在将常见的一些报错处理方法整理出来分享 ...

  3. 接口测试之——Charles抓包及常见问题解决(转载自https://www.jianshu.com/p/831c0114179f)

    简介 Charles其实是一款代理服务器,通过成为电脑或者浏览器的代理,然后截取请求和请求结果达到分析抓包的目的.该软件是用Java写的,能够在Windows,Mac,Linux上使用,安装Charl ...

  4. jar与war包区别,转自https://www.jianshu.com/p/3b5c45e8e5bd

    https://www.jianshu.com/p/3b5c45e8e5bd

  5. https://www.jianshu.com/p/1038c6170775

    import os # 方法一: os.walk实现 def items_dir(rootname): l = [] for main_dir, dirs, file_name_list in os. ...

  6. Redis 单线程却能支撑高并发 - 简书 https://www.jianshu.com/p/2d293482f272

    小结: 1.在 I/O 多路复用模型中,最重要的函数调用就是 select,该方法的能够同时监控多个文件描述符的可读可写情况:2.Redis 服务采用 Reactor 的方式来实现文件事件处理器(每一 ...

  7. 当我写下Map<String,Object> map = new HashMap<>() https://www.jianshu.com/p/6b2e350e99be

    当我写下Map<String,Object> map = new HashMap<>();我到底在写什么? 我什么时候会写HashMap? 一个函数同时需要返回 多种 状态的情 ...

  8. Asp.Net Core 第01局:项目创建和部署 转载https://www.jianshu.com/p/9c9750e23b3e

    总目录 一.前言 本文通过从项目创建到部署,简单介绍Asp.Net Core. 二.环境 1.Visual Studio 2017 2.Asp.Net Core 2.2 三.开局 第一手:创建项目   ...

  9. 分布式--ActiveMQ 消息中间件(一) https://www.jianshu.com/p/8b9bfe865e38

    1. ActiveMQ 1). ActiveMQ ActiveMQ是Apache所提供的一个开源的消息系统,完全采用Java来实现,因此,它能很好地支持J2EE提出的JMS(Java Message ...

随机推荐

  1. MySQL 数据库备份策略:全备与增量备份

    一.备份策略1.周日全备份,周一至周六增量备份2.全备份目录/u03/backup/innobackup/full_backup3.增量备份目录/u03/backup/innobackup/incre ...

  2. 2.16 C++类与new和delete操作符

    参考: http://www.weixueyuan.net/view/6347.html 总结: 当我们需要为类对象动态分配存储空间时,我们应该使用C++语言提供的new与new[]操作符,而不要使用 ...

  3. system的消息队列实例

    1\创建或打开消息队列函数原型:int msgget(key_t key, int msgflg)参数第一个参数为ftok方法创建的一个kety_t或者为一个整数值第二个参数为逻辑控制,IPC_CRE ...

  4. 数位DP详解

    算法使用范围 在一个区间里面求有多少个满足题目所给的约束条件的数,约束条件必须与数自身的属性有关 下面用kuangbin数位dp的题来介绍 例题  不要62 题意:在一个区间里面求出有多少个不含4和6 ...

  5. HTML5触摸事件(touchstart、touchmove和touchend)

      HTML5中新添加了很多事件,但是由于他们的兼容问题不是很理想,应用实战性不是太强,所以在这里基本省略,咱们只分享应用广泛兼容不错的事件,日后随着兼容情况提升以后再陆续添加分享.今天为大家介绍的事 ...

  6. shiro学习笔记(四) ini配置以及加解密

    INI配置 从之前的Shiro架构图可以看出,Shiro是从根对象SecurityManager进行身份验证和授权的:也就是所有操作都是自它开始的,这个对象是线程安全且真个应用只需要一个即可,因此Sh ...

  7. <Spark Streaming><Flume><Integration>

    Overview Flume:一个分布式的,可靠的,可用的服务,用于有效地收集.聚合.移动大规模日志数据 我们搭建一个flume + Spark Streaming的平台来从Flume获取数据,并处理 ...

  8. L258 技术转让

    We will inform you of the weight, measurements, number of cases, cost of the drawings and other docu ...

  9. 搭建Django项目

    命令行搭建Django项目 1.安装django 在指定解释器环境下安装django 1.11.9 在真实python3环境下: pip3 install django==1.11.9 在虚拟环境下: ...

  10. centos安装htop

    在 Linux 系统中,top 命令用来显示系统中正在运行的进程的实时状态,它显示了一些非常有用的信息,比如 CPU 利用情况.内存消耗情况,以及每个进程情况等.但是,你知道吗?还有另外一个命令行工具 ...