分布式文件系统FastDFS

时间:2022-07-24
本文章向大家介绍分布式文件系统FastDFS,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

FastDFS是一个开源的轻量级分布式文件系统,开发语言为C,适合以小型文件为载体的在线服务,如相册网站、图片服务器等等。

github地址:https://github.com/happyfish100/fastdfs

架构图如下

几个重要的概念:tracker、storage、client

client就是调用方,tracker负责元数据,要上传文件、下载文件先从tracker获取相应的storage,然后client和storage交互,进行实际的文件上传、下载等操作。

FastDFS 没有实现自己的存储,而是使用操作系统的文件系统进行存储的,实际存储是按两级目录来保存文件的。

一、安装

实际安装的是5.11版本,安装目录设置为 /opt

1、安装libfastcommon

fastdfs依赖这个库

cd /opt
wget https://github.com/happyfish100/libfastcommon/archive/master.zip
unzip libfastcommon-master.zip
cd libfastcommon-master
make.sh
/make.sh install

2、安装FastDFS

cd opt
wget https://github.com/happyfish100/fastdfs/archive/master.zip
unzip fastdfs-master.zip
cd fastdfs-master
./make.sh
./make.sh install

3、配置

#配置拷贝
cd /etc/fdfs/
ls
client.conf.sample  storage.conf.sample  tracker.conf.sample
cp client.conf.sample client.conf
cp storage.conf.sample storage.conf
cp tracker.conf.sample tracker.conf

tracker中一些重要的参数如下

base_path

max_connections

connect_timeout

network_timeout

work_threads

sync_log_buff_interval

storage一些重要参数:

connect_timeout

network_timeout

heart_beat_interval

base_path

max_connections

work_threads

tracker_server(可以设置多行)

这里不具体详述每个参数的意义,具体可以参考官方文档。

二、使用

1、php

安装扩展,代码在FastDFS 的php_client目录,按标准的扩展安装即可。

安装完在php.ini加上如下,路径根据自己安装目录调整

fastdfs_client.base_path=/opt/fastdfs
fastdfs_client.tracker_group_count = 1
fastdfs_client.tracker_group0 = /etc/fdfs/client.conf

示例代码如下

<?php
    //上传文件
    function uploadFile(){
        $fdfs = new FastDFS();
        $tracker = $fdfs->tracker_get_connection();
        $storager = $fdfs->tracker_query_storage_store('group1', $tracker);
        $localFileName = '/home/liujh/projects/xman/url.txt';
        $fileRes = $fdfs->storage_upload_by_filename($localFileName, "txt", ["image" => "url"], "group1", $tracker, $storager);
        var_dump($fileRes);
        $fdfs->tracker_close_all_connections();
    }
 
    //获取文件信息
    function getFile(){
        $fileName = 'M00/00/00/rBVq5F1DyCOAURnnAAAPAnkf924742.txt';
        $fdfs = new FastDFS();
        $buf = $fdfs->storage_download_file_to_buff('group1', $fileName);
        var_dump($buf);
    }
    //获取文件元信息
    function getMeta(){
        $fileName = 'M00/00/00/rBVq5F1DyCOAURnnAAAPAnkf924742.txt';
        $fdfs = new FastDFS();
        $buf = $fdfs->storage_get_metadata('group1', $fileName);
        var_dump($buf);
    }
 
    //删除文件
    function delete(){
        $fileName = 'M00/00/00/rBVq5F1DyCOAURnnAAAPAnkf924742.txt';
        $fdfs = new FastDFS();
        $buf = $fdfs->storage_delete_file('group1', $fileName);
        var_dump($buf);
    }
    getFile();

2、Java

先在init方法进行初始化

public class FastDFSClintFactor{
@Value("#{'${connectTimeout}'}")
private String connectTimeout;

@Value("#{'${tracker_server}'}")
private String trackerServers;
  
//初始化
private void init(){
// 链接超时
      if(connectTimeout != null && connectTimeout.length > 0){
        ClientGlobal.setG_connect_timeout(Integer.valueOf(connectTimeout));
      } else {
        ClientGlobal.setG_connect_timeout(ClientGlobal.DEFAULT_CONNECT_TIMEOUT);
      }
      
      
      // 服务器
      if((trackerServers!= null && trackerServers.length > 0!)){
        InetSocketAddress[] addresss = this.getTrackerServerArray(trackerServers);
        ClientGlobal.setG_tracker_group(new TrackerGroup(addresss));
      } else {
        throw new NullPointerException("the value of item "tracker_server" is null. ");
      }
   }
   
 }

再创建trackerServer

// 链接服务器
      trackerServer = new TrackerClient().getConnection();

最后是创建client及使用

public StorageClient getStorageClient(){
    return new StorageClient(trackerServer, null);
  }
  
 
   // 文件属性
    List<NameValuePair> nvpList = new ArrayList<NameValuePair>(); 
    nvpList.add(new NameValuePair(FILENAME_KEY, fileSrcName));  
    nvpList.add(new NameValuePair(FILEEXTNAME_KEY, fileExtName));  
    NameValuePair[] metas = nvpList.toArray(new NameValuePair[0]);
    
    // 上传文件
    try {
      StorageClient sc = fastDFSManager.getStorageClient();
      String[] result = sc.upload_file(bytes, fileExtName, metas);
      }catch (Exception e) {
      logger.error("上传文件到FastDFS服务器异常,文件名:" + fileName, e);
      return null;
    }

三、使用踩坑

刚上线时有时候一些文件写入时大小为0,看了代码目前是长连接的实现方式,在MSHUT_DONW中才关闭连接,实际生产环境php-fpm的max_request会配置较大,造成服务端关闭连接但客户端还没关闭,因而许多连接取不到数据,修复方案改为短连接,修改文件fastdfs_client.c,代码如下:

//启用
zend_module_entry fastdfs_client_module_entry = {
STANDARD_MODULE_HEADER,
"fastdfs_client",
fastdfs_client_functions,
PHP_MINIT(fastdfs_client),
PHP_MSHUTDOWN(fastdfs_client),
NULL,//PHP_RINIT(fastdfs_client),
PHP_RSHUTDOWN(fastdfs_client),//PHP_RSHUTDOWN(fastdfs_client),
PHP_MINFO(fastdfs_client),
"1.00",
STANDARD_MODULE_PROPERTIES
};


PHP_RSHUTDOWN_FUNCTION(fastdfs_client)
{
FDFSConfigInfo *pConfigInfo;
FDFSConfigInfo *pConfigEnd;
if (!g_use_connection_pool){
  if (config_list != NULL)
  {
    pConfigEnd = config_list + config_count;
    for (pConfigInfo=config_list; pConfigInfo<pConfigEnd; 
      pConfigInfo++)
    {
      if (pConfigInfo->pTrackerGroup != NULL)
      {
        tracker_close_all_connections_ex( 
            pConfigInfo->pTrackerGroup);
      }
    }
  }
}

return SUCCESS;
}

四、写在最后

从架构图来看,FastDFS是高可用的,但故障发生时会丢失数据吗?答案是会丢,因为storage之间的文件同步是异步的,所以在client上传文件完后,storage已经返回响应给client了,如果这个时候文件还没有同步到其它的storage,则这个文件就丢了。

这里还有个问题,如果storage cluster有2个实例 st1, st2,如果client将文件上传到st1上,这个时间如果文件还没有同步到st2,这个时间client访问到st2了,这个时间就取不到数据了。针对这个问题,可以安装nginx模块

fastdfs-nginx-module来解决,不过这样一来运维成本也增加了,系统的复杂性也增加了。

总的来说,FastDFS是一个勉强能用的分布式文件系统,离真正的高可用、不丢数据、运维方便还有些距离。