FastDFS详解
1. 场景概述
- 天猫,淘宝等购物网站,大量的图片和视频,文件太多,如何存储?
- 用户访问量大又如何保证下载速度?分布式文件系统就是解决这些问题的!
1.1 什么是文件系统
- 文件数据是如何存储的??
1.2 分布式文件系统
- 一台电脑存储量有限,并且并发吞吐量也有限,如何提高性能?
- 一吨货物,我要运送到吐鲁番:
- 1个人运,不敢想象
- 50个人运,太难了;
- 500个人运,每个人都很轻松;
- 这就是分布式吗?
- 这里面有集群的概念,也有分布式的概念,二者不要混淆,面试常问的经典题目
- 分布式:不同的业务模块部署在不同的服务器上或者同一个业务模块分拆多个子业务,部署不同的服务器上。解决高并发的问题;
- 集群:同一个业务部署在多台服务器上,提高系统的高可用
1.3 主流的分布式文件系统
1.3.1 HDFS
- (Hadoop Distributed File System)Hadoop 分布式文件系统;
- 高容错的系统,适合部署到廉价的机器上;
- 能提供高吞吐量的数据访问,非常适合大规模数据应用;
- HDFS采用主从结构,一个HDFS是由一个name节点和N个data节点组成;
- name节点储存元数据,一个文件分割成N份存储在不同的data节点上。
1.3.2 GFS
- Google File System
- 可扩展的分布式文件系统,用于大型的,分布式的,对大量数据进行访问的应用;
- 运行于廉价的普通硬件上,可以提供容错功能;
- 它可以给大量的用户提供总体性能较高的服务;
- GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver(分块服务器)组成;
- 一个文件被分割若干块,分散储存到多个分块server中
1.3.3.FastDFS
由淘宝资深架构师余庆编写并开源;
专为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务;
HDFS,GFS等都是通用的文件系统,他们的优点是开发体验好,但是系统的复杂度较高,性能也一般;
相比之下,专用的分布式文件系统体验差,但是复杂度低,性能也高,尤其fastDFS特别适合图片,小视频等小文件,因为fastDFS对文件是不分割的,所以没有文件合并的开销;
网络通信用socket,速度快。
1.4 工作原理
- fastDFS包含Tracker Server和Storage Server;
- 客户端请求Tracker Server进行文件的上传与下载;
- Tracker Server调度Storage Server最终完成上传与下载。
- Tracker (译:追踪者)
- 作用是负载均衡和调度,它管理着存储服务(Storage Server),可以理解为:“大管家,追踪者,调度员”;
- Tracker Server可以集群,实现高可用,策略为“轮询”。
- Storage (译:仓库; 贮存器)
- 作用是文件存储,客户端上传的文件最终存储到storage服务器上;
- storage集群采用分组的方式,同组内的每台服务器是平等关系,数据同步,目的是实现数据备份,从而高可用,而不同组的服务器之间是不通信的;
- 同组内的每台服务器的存储量不一致的情况下,会选取容量最小的那个,所以同组内的服务器之间软硬件最好保持一致。
- Storage Server会连接集群中的所有Tracker Server,定时向他们汇报自己的状态,例如:剩余空间,文件同步情况,文件上传下载次数等信息。
1.5 上传/下载 原理
- 客户端上传文件后,storage会将文件id返回给客户端
- group1/M00/02/11/aJxAeF21O5wAAAAAAAAGaEIOA12345.sh
- 组名:文件上传后,在storage组的名称,文件上传成功后,由storage返回,需要客户端自行保存。
- 虚拟磁盘路径:storage配置的虚拟路径,在磁盘选项storage_path对应。storage_path0对应M00,storage_path1对应M01,
- 数据两级目录:storage在虚拟磁盘下自行创建的目录。
- 文件名:与上传时不同,是用storage根据特定信息生成的,里面包含:storage服务器的ip,创建时间戳,大小,后缀名等信息
2. FastDFS的上传与下载
2.1 安装
2.1.1 安装gcc(编译时需要)
1 | yum install -y gcc gcc-c++ |
2.1.2 安装libevent(运行时需求)
1 | yum -y install libevent |
2.1.3 安装 libfastcommon
libfastcommon是FastDFS官方提供的,libfastcommon包含了FastDFS运行所需要的一些基础库。
上传 libfastcommon-master.zip 到 /opt
1
2
3安装解压zip包的命令: yum install -y unzip
解压包: unzip libfastcommon.zip
进入目录: cd libfastcommon-master编译
1
2
3./make.sh
# 如果:make.sh的权限不够,则需要授权(可执行的权利)
# chmod 777 make.sh安装
1
2./make.sh install
# libfastcommon安装好后会在/usr/lib64 目录下生成 libfastcommon.so 库文件拷贝库文件
1
2cd /usr/lib64
cp libfastcommon.so /usr/lib
2.1.4 安装Tracker
下载 FastDFS_v5.05.tar.gz,并上传到 /opt
1 | tar -zxvf FastDFS_v5.05.tar.gz |
2.2 配置
Tracker配置
1
vim /etc/fdfs/tracker.conf
1
2
3
4
5#端口号
port=22122
#基础目录(Tracker运行时会向此目录存储storage的管理数据)(基础目录不存在的话,需要自行创建 mkdir /home/fastdfs)
base_path=/home/fastdfsStorage配置
1
vim /etc/fdfs/storage.conf
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21#配置组名
group_name=group1
#端口
port=23000
#向tracker心跳间隔(秒)
heart_beat_interval=30
#storage基础目录
#目录不存在,需要自行创建
base_path=/home/fastdfs
#store存放文件的位置(store_path)
#可以理解一个磁盘一个path,多个磁盘,多个store_path
#fdfs_storage目录不存在,需要自行创建
#mkdir /home/fastdfs/fdfs_storage
store_path0=/home/fastdfs/fdfs_storage
#如果有多个挂载磁盘则定义多个store_path,如下
#store_path1=..... (M01)
#store_path2=..... (M02)
#配置tracker服务器:IP
tracker_server=10.1.220.247:22122
#如果有多个则配置多个tracker
#tracker_server=10.1.220.x:22122
2.3 启动服务
启动tracker
1
/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart
启动storage
1
/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart
查看所有运行的端口:
1
netstat -ntlp
2.4 搭建Java工程
使用IDEA创建maven工程
2.4.1 pom.xml
1 | <!--fastdfs的java客户端--> |
2.4.2 创建配置文件
在resources下创建config目录,在config目录下创建 fastdfs-client.properties,内容如下:
1 | ##fastdfs-client.properties |
2.4.3 文件上传
1 | package test; |
2.4.4 文件查询
1 | package test; |
2.4.5 文件下载
1 | package test; |
3. 项目实战
- 掌握fastDFS在真实项目中的使用方法;
- 掌握fastDFS实现图片服务器;
3.1 搭建图片服务器
3.1.1 Nginx模块安装 (Storage)
上传 fastdfs-nginx-module_v1.16.tar.gz 到 /opt
解压nginx模块
1
tar -zxvf fastdfs-nginx-module_v1.16.tar.gz
修改 config 文件,将文件中的 /usr/local/ 路径改为 /usr/
1
2cd /opt/fastdfs-nginx-module/src
vim config将 fastdfs-nginx-module/src下的 mod_fastdfs.conf 拷贝至 /etc/fdfs 下
1
cp mod_fastdfs.conf /etc/fdfs/
修改 /etc/fdfs/mod_fastdfs.conf
1
vim /etc/fdfs/mod_fastdfs.conf
1
2
3
4
5
6
7
8base_path=/home/fastdfs
tracker_server=10.1.220.247:22122
#(n个tracker配置n行)
#tracker_server=10.1.220.x:22122
#url中包含group名称
url_have_group_name=true
#指定文件存储路径(上面配置的store路径)
store_path0=/home/fastdfs/fdfs_storage将 libfdfsclient.so 拷贝至 /usr/lib 下
1
cp /usr/lib64/libfdfsclient.so /usr/lib/
创建nginx/client目录
1
mkdir -p /var/temp/nginx/client
3.1.2 Nginx安装 (Tracker)
将 nginx-1.14.0.tar.gz上传到/opt(安装过nginx,此步省略)
解压:tar -zxvf nginx-1.14.0.tar.gz(安装过nginx,此步省略)
安装依赖库(安装过nginx,此步省略)
1
2
3
4
5
6yum install pcre
yum install pcre-devel
yum install zlib
yum install zlib-devel
yum install openssl
yum install openssl-devel进入nginx解压的目录下 cd /opt/nginx-1.14.0
安装
1
./configure \ --prefix=/usr/local/nginx \ --pid-path=/var/run/nginx/nginx.pid \ --lock-path=/var/lock/nginx.lock \ --error-log-path=/var/log/nginx/error.log \ --http-log-path=/var/log/nginx/access.log \ --with-http_gzip_static_module \ --http-client-body-temp-path=/var/temp/nginx/client \ --http-proxy-temp-path=/var/temp/nginx/proxy \ --http-fastcgi-temp-path=/var/temp/nginx/fastcgi \ --http-uwsgi-temp-path=/var/temp/nginx/uwsgi \ --http-scgi-temp-path=/var/temp/nginx/scgi \ --add-module=/opt/fastdfs-nginx-module/src
**注意:**上边将临时文件目录指定为 /var/temp/nginx,需要在 /var 下创建 temp 及 nginx 目录:mkdir/var/temp/nginx
编译:make
安装:make install
拷贝配置文件
1
2
3cd /opt/FastDFS/conf
cp http.conf mime.types
/etc/fdfs/ 是否覆盖:yes修改nginx配置文件
1
2cd /usr/local/nginx/conf/
vim nginx.conf1
2
3
4
5
6
7
8
9server {
listen 80;
server_name 10.1.220.247;
#charset koi8-r;
#access_log logs/host.access.log main;
location /group1/M00 {
root /home/fastdfs/fdfs_storage/data;
ngx_fastdfs_module;
}关闭nginx,并启动nginx
1
2pkill -9 nginx
/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf访问nginx并查看图片
http://10.1.220.247/group1/M00/00/00/CgHc918f8l6AFYp0AAWICfQnHuk889.jpg
3.2 创建前端页面
1 | <!--上传文件,文件与文字相比较起来,属于内容较大,必须使用post方式提交--> |
3.3 搭建web服务
3.3.1 pom.xml
1 | <packaging>war</packaging> |
3.3.2 web.xml
1 |
|
3.3.3 spring-mvc.xml
1 | <!--扫描注解的包--> |
3.3.4 文件实体类
1 | public class FileSystem implements Serializable { |
3.3.5 控制层
1 | package controller; |
3.3.6 添加fastDFS的配置文件
在resources下创建config目录,在config目录下创建 fastdfs-client.properties
参考:2.4.2
3.3.7 启动fastDFS服务,测试开始
1 | [root@localhost /]# /usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart |
3.6 典型错误
重启linux服务器,可能会到nginx启动失败:
1
2[root@localhost logs]# /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
[root@localhost /]# nginx: [emerg] open() "/var/run/nginx/nginx.pid" failed (2: No such file or directory)导致本次错误的原因,是没有修改pid文件的路径,编辑nginx的配置文件:
1
vim /usr/local/nginx/conf/nginx.conf
1
pid /usr/local/nginx/logs/nginx.pid;
再次启动nginx,搞定!