您的位置:首页 > 运维架构 > Nginx

基于MogileFS+mysql+nginx实现分布文件存储与访问 推荐

2014-05-10 19:12 731 查看
一、MogileFS简介

MogileFS是一个开源的分布式文件存储系统,由LiveJournal旗下的Danga Interactive公司开发。Danga团队开发了包括 Memcached、MogileFS、Perlbal 等多个知名的开源项目。目前使用MogileFS 的公司非常多,如日本排名先前的几个互联公司及国内的yupoo(又拍)、digg、豆瓣、1号店、大众点评、搜狗和安居客等,分别为所在的组织或公司管理着海量的图片。

MogileFS由3个部分组成:
(1) server:主要包括mogilefsd和mogstored两个应用程序。mogilefsd实现的是tracker,它通过数据库来保存元数据信息,包括站点domain、class、host等;mogstored是存储节点(store node),它其实是个WebDAV服务,默认监听在7500端口,接受客户端的文件存储请求。在MogileFS安装完后,要运行mogadm工具将所有的store node注册到mogilefsd的数据库里,mogilefsd会对这些节点进行管理和监控。
(2) utils(工具集):主要是MogileFS的一些管理工具,例如mogadm等。
(3) 客户端API:MogileFS的客户端API很多,例如Perl、PHP、Java、Python等,用这个模块可以编写客户端程序,实现文件的备份管理功能等。
具体的应用层特点:
应用层——没有特殊的组件要求
无单点失败——MogileFS启动的三个组件(存储节点、跟踪器、跟踪用的数据库),均可运行在多个 机器上,因此没有单点失败。(你也可以将跟踪器和存储节点运行在同一台机器上,这样你就没有必要用4台机器)推荐至少两台机器。
自动的文件复制——文件是基于他们的“类”,文件可以自动的在多个存储节点上复制,这是为了尽量少的复制,才使用“类”的。加入你有的图片站点有三份JPEG图片的拷贝,但实际只有1or2份拷贝,那么Mogile可以重新建立遗失的拷贝数。用这种办法,MogileFS(不做RAID)可以节约在磁盘,否则你将存储同样的拷贝多份,完全没有必要。
“比RAID好多了”——在一个非存储区域网络的RAID(non-SAN RAID)的建立中,磁盘是冗余的,但主机不是,如果你整个机器坏了,那么文件也将不能访问。 MogileFS在不同的机器之间进行文件复制,因此文件始终是可用的。
传输中立,
无特殊协议——MogileFS客户端可以通过NFS或HTTP来和MogileFS的存储节点来通信,但首先需要告知跟踪器一下。
简单的命名空间——文件通过一个给定的key来确定,是一个全局的命名空间。你可以自己生成多个命名空间,只要你愿意,但是这样可能在同一MogileFS中,会造成冲突key。
不用共享任何东西——MogileFS不需要依靠昂贵的SAN来共享磁盘,每个机器只用维护好自己的磁盘。
不需要RAID——在MogileFS中的磁盘可以是做了RAID的也可以是没有,如果是为了安全性着想的话RAID没有必要买了,因为MogileFS已经提供了。
不会碰到文件系统本身的不可知情况——在MogileFS中的存储节点的磁盘可以被格式化成多种格式(ext3,reiserFS等等)。MogilesFS会做自己内部目录的哈希,所以它不会碰到文件系统本身的一些限制,比如一个目录中的最大文件数。 http://bbs.chinaunix.net/thread-1235868-1-1.html(具体的应用层特点)thanks: happy_fish100 http://www.csource.org/ big niu(大牛) 其写的FastDFS
二,本次实验用到的架构图




node1 MariaDB10的解压安装这里不再描述,请自行google
为了与MogileFS与MySQL协同工作,需要在MySQL新建如下两个用户
grant all privileges on *.* to 'moguser'@'172.%.251.%' identified by 'mogpass';
grant all privileges on *.* to 'root'@'172.%.251.%' identified by 'root';
这里着重介绍安装MogileFS
node2安装MogileFS安装



查看安装的软件信息
[root@node2 mogilefs]# rpm -qa|grep -i mogilefs
MogileFS-Utils-2.19-1.el6.noarch
MogileFS-Server-mogilefsd-2.46-2.el6.noarch
MogileFS-Server-mogstored-2.46-2.el6.noarch
perl-MogileFS-Client-1.14-1.el6.noarch
MogileFS-Server-2.46-2.el6.noarch
[root@node2 mogilefs]# rpm -ql MogileFS-Server-mogilefsd
/etc/mogilefs/mogilefsd.conf
/etc/rc.d/init.d/mogilefsd
/usr/bin/mogdbsetup
/usr/bin/mogilefsd
/usr/share/man/man1/mogilefsd.1.gz
/usr/share/man/man3/MogileFS::Checksum.3pm.gz
/usr/share/man/man3/MogileFS::Class.3pm.gz
。。。。。。。。。。。。。。。。。。。。。。。。
[root@node2 mogilefs]# rpm -ql MogileFS-Server-mogstored
/etc/mogilefs/mogstored.conf
/etc/rc.d/init.d/mogstored
/usr/bin/mogautomount
/usr/bin/mogstored
/usr/share/man/man1/mogautomount.1.gz
/usr/share/man/man1/mogstored.1.gz
/usr/share/perl5/vendor_perl/Mogstored/ChildProcess
/usr/share/perl5/vendor_perl/Mogstored/ChildProcess.pm
。。。。。。。。。。。。。。。。。。。。。。。。。。。。
[root@node2 mogilefs]# rpm -ql MogileFS-Utils
/usr/bin/mogadm
/usr/bin/mogdelete
/usr/bin/mogfetch
/usr/bin/mogfiledebug
/usr/bin/mogfileinfo
/usr/bin/moglistfids
/usr/bin/moglistkeys
/usr/bin/mogrename
/usr/bin/mogstats
/usr/bin/mogtool
/usr/bin/mogupload
。。。。。。。。。。。。。。。。。。。
修改目录权限,使用mogilefs用户能够有权限访问

[root@node2 mogilefs]# chown -R mogilefs.mogilefs /var/run/mogilefsd/
[root@node2 mogilefs]# mkdir -pv /dfsdata/mogdata/dev2
## dev# 此#号尽量与主机所在的节点号一致,便于区分理解如:node1,dev1;node2,dev2
[root@node2 mogilefs]# chown -R mogilefs.mogilefs /dfsdata/mogdata
在node2建立与node1上MySQL的连接




mogdbsetup --dbhost=172.16.251.21 --dbport=3306 --dbname=mogdb --dbrootuser=root --dbrootpass=root --dbuser=moguser --dbpass=mogpass --yes


修改配置文件/etc/mogilefs/mogilefsd.conf ,mogsotred.conf (配置成功的文件,也要同步到其它两个节点上,node3,node4)




启动mogilefsd mogstored 服务,并查看状态

[root@node2 mogilefs]#service mogilefsd start
[root@node2 mogilefs]#service mogstored start
[root@node2 mogilefs]# ss -tunlp |grep mog
tcp    LISTEN     0      128                    *:7500                  *:*      users:(("mogstored",7221,4))
tcp    LISTEN     0      128                    *:7501                  *:*      users:(("mogstored",7221,9))
tcp    LISTEN     0      128                    *:7001                  *:*      users:(("mogilefsd",3773,6))
[root@node2 mogilefs]#
注意以上mogileFS安装步骤同样也要在node3,node4节点上安装一遍,切记不要再进行数据的初始化操作,原因是node2已经完成初始化,三个节点共享库中的信息

接下来是具体的配置阶段
增加自己本身为trackers 和mogstored
[root@node2 mogilefs]# mogadm --trackers=172.16.251.22:7001 host add 172.16.251.22 --ip=172.16.251.22 --status=alive
[root@node2 mogilefs]# mogadm --trackers=172.16.251.22:7001 host list
172.16.251.22 [1]: alive
IP:       172.16.251.22:7500
[root@node2 mogilefs]# mogadm --trackers=172.16.251.22:7001 host add 172.16.251.23 --ip=172.16.251.23 --status=alive
[root@node2 mogilefs]# mogadm --trackers=172.16.251.22:7001 host list
172.16.251.22 [1]: alive
IP:       172.16.251.22:7500
172.16.251.23 [2]: alive
IP:       172.16.251.23:7500
[root@node2 mogilefs]#
也可以在node3节点上,增加node4上的节点资源,如下

[root@node3 mogdata]# mogadm --trackers=172.16.251.23:7001 host list
172.16.251.22 [1]: alive
IP:       172.16.251.22:7500
172.16.251.23 [2]: alive
IP:       172.16.251.23:7500
[root@node3 mogdata]# mogadm --trackers=172.16.251.23:7001 host add 172.16.251.24 --ip=172.16.251.24 --status=alive
[root@node3 mogdata]# mogadm --trackers=172.16.251.23:7001 host list
172.16.251.22 [1]: alive
IP:       172.16.251.22:7500
172.16.251.23 [2]: alive
IP:       172.16.251.23:7500
172.16.251.24 [3]: alive
IP:       172.16.251.24:7500
查看整体的节点信息:
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 host list



增加更节点的设备
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 device add 172.16.251.22 1
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 device add 172.16.251.23 2
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 device add 172.16.251.24 3
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 device list



介绍mogileFS系统中的几个概念 https://code.google.com/p/mogilefs/wiki/Glossary

domain

A domain is the top level separation of files. File keys are unique within domains. A domain consists of a set of classes that define the files within the domain. Examples of domains: fotobilder, livejournal.域是顶层文件的分离。域内文件密钥是独一无二的。一个域由一组类定义文件的域。域的例子:fotobilder,livejournal

class

Every file is part of exactly one class. A class is part of exactly one domain. A class, in effect, specifies the minimum replica count of a file. Examples of classes: userpicture, userbackup, phonepost. Classes may have extra replication policies defined.每个文件是一个类的一部分。一个类是一个域的一部分。实际上,类是指定文件的最小副本数。类的例子:userpicture、userbackup phonepost。类还可以定义额外的复制策略。

key

A key is a unique textual string that identifies a file. Keys are unique within domains. Examples of keys: userpicture:34:39, phonepost:93:3834, userbackup:15. Fake structures work too: /pics/hello.png, any string.关键字是用唯一(unique)的,独特的文本字符串来标识一个文件(可以理解为变量名)。关键字领域内(全局)是独一无二的。

minimum replica count (mindevcount)最小副本(复制)数量

This is a property of a class. This defines how many times the files in that class need to be replicated onto different devices in order to ensure redundancy among the data and prevent loss.是类的属性。此数值定义了类中多少数量的文件需要复制到不同的设备,以确保数据之间的冗余和防止损失。

file

A file is a defined collection of bits uploaded to MogileFS to store. Files are replicated according to their minimum replica count. Each file has a key, is a part of one class, and is located in one domain. Files are the things that MogileFS stores for you.文件上传到MogileFS存储。依据其最低副本数数量进行文件复制。每个文件都有一个关键字,是一个类的一部分,位于一个域。MogileFS提供文件

fid file identifier

A fid is an internal numerical representation of a file. Every file is assigned a unique fid. If a file is overwritten, it is given a new fid.fid 是mogileFS内部表示一个文件的文件ID,且全局唯一,如果重写,则将生成一新的fid
增加域(domain),类(class)
增加域(domain)



[root@node2 ~]# mogadm domain
Help for 'domain' command:
(enter any command prefix, leaving off options, for further help)
mogadm domain add <domain>                         Add a domain (namespace)
mogadm domain delete <domain>                      Delete a domain.
mogadm domain list                                 List all hosts.
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 domain add images
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 domain add files
[root@node2 ~]# mogadm --trackers=172.16.251.22:7001 domain list
对应的域中增加类,并确定mindevcount



域中的默认类能删除么?答案是不能删除的



完成的域,类的添加(到这里可以理解为:为文件装备的存放position(domain),numbers (class)),
上传文件及显示



在MogileFS系统中文件显示



Nginx反向代理访问MogileFS文件系统的设置与安装

前端nginx的安装与设置,要想Nginx代理访问mogileFS文件系统中的文件,要安装nginx-mogile插件,下面介绍安装的软件具体版本



解压文件并安装,注:安装时加载第三方插件的安装方式,
[root@node5 mogilefs]#useradd -r nginx
[root@node5 mogilefs]#./configure   --prefix=/usr   --sbin-path=/usr/sbin/nginx   --conf-path=/etc/nginx/nginx.conf   --error-log-path=/var/log/nginx/error.log   --http-log-path=/var/log/nginx/access.log   --pid-path=/var/run/nginx/nginx.pid    --lock-path=/var/lock/nginx.lock   --user=nginx   --group=nginx   --with-http_ssl_module   --with-http_flv_module   --with-http_stub_status_module   --with-http_gzip_static_module   --http-client-body-temp-path=/var/tmp/nginx/client/   --http-proxy-temp-path=/var/tmp/nginx/proxy/   --http-fastcgi-temp-path=/var/tmp/nginx/fcgi/   --http-uwsgi-temp-path=/var/tmp/nginx/uwsgi   --http-scgi-temp-path=/var/tmp/nginx/scgi   --with-pcre   --with-debug   --add-module=../nginx-mogilefs-module-master
安装服务配置脚本
[root@node5 mogilefs]#vim /etc/rc.d/init.d/nginx
#!/bin/sh
#
# nginx - this script starts and stops the nginx daemon
#
# chkconfig:   - 85 15
# description:  Nginx is an HTTP(S) server, HTTP(S) reverse \
#               proxy and IMAP/POP3 proxy server
# processname: nginx
# config:      /etc/nginx/nginx.conf
# config:      /etc/sysconfig/nginx
# pidfile:     /var/run/nginx.pid

# Source function library.
. /etc/rc.d/init.d/functions

# Source networking configuration.
. /etc/sysconfig/network

# Check that networking is up.
[ "$NETWORKING" = "no" ] && exit 0

nginx="/usr/sbin/nginx"
prog=$(basename $nginx)

NGINX_CONF_FILE="/etc/nginx/nginx.conf"

[ -f /etc/sysconfig/nginx ] && . /etc/sysconfig/nginx

lockfile=/var/lock/subsys/nginx

make_dirs() {
# make required directories
user=`nginx -V 2>&1 | grep "configure arguments:" | sed 's/[^*]*--user=\([^ ]*\).*/\1/g' -`
options=`$nginx -V 2>&1 | grep 'configure arguments:'`
for opt in $options; do
if [ `echo $opt | grep '.*-temp-path'` ]; then
value=`echo $opt | cut -d "=" -f 2`
if [ ! -d "$value" ]; then
# echo "creating" $value
mkdir -p $value && chown -R $user $value
fi
fi
done
}

start() {
[ -x $nginx ] || exit 5
[ -f $NGINX_CONF_FILE ] || exit 6
make_dirs
echo -n $"Starting $prog: "
daemon $nginx -c $NGINX_CONF_FILE
retval=$?
echo
[ $retval -eq 0 ] && touch $lockfile
return $retval
}

stop() {
echo -n $"Stopping $prog: "
killproc $prog -QUIT
retval=$?
echo
[ $retval -eq 0 ] && rm -f $lockfile
return $retval
}

restart() {
configtest || return $?
stop
sleep 1
start
}

reload() {
configtest || return $?
echo -n $"Reloading $prog: "
killproc $nginx -HUP
RETVAL=$?
echo
}

force_reload() {
restart
}

configtest() {
$nginx -t -c $NGINX_CONF_FILE
}

rh_status() {
status $prog
}

rh_status_q() {
rh_status >/dev/null 2>&1
}

case "$1" in
start)
rh_status_q && exit 0
$1
;;
stop)
rh_status_q || exit 0
$1
;;
restart|configtest)
$1
;;
reload)
rh_status_q || exit 7
$1
;;
force-reload)
force_reload
;;
status)
rh_status
;;
condrestart|try-restart)
rh_status_q || exit 0
;;
*)
echo $"Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload|configtest}"
exit 2
esac
# chmod +x /etc/rc.d/init.d/nginx
# chkconfig --add nginx
# chkconfig nginx on
# service nginx start
编辑配置文件/etc/nginx/nginx.conf 如下所示



[root@node5 nginx]# grep -v "^[[:space:]].*#" nginx.conf |grep -v "^#" |grep -v "^$"
worker_processes  1;
error_log   /var/log/nginx_error.log  notice;
events {
worker_connections  1024;
}
http {
include       mime.types;
default_type  application/octet-stream;
sendfile        on;
keepalive_timeout  65;
upstream mogileserver {
server  172.16.251.22:7001;
server  172.16.251.23:7001;
server  172.16.251.24:7001;
}
server {
listen       80;
server_name  localhost;
location / {
root   html;
index  index.html index.htm;
}
location ~* ^(/images/.*)$ {
mogilefs_tracker mogileserver;
mogilefs_domain images;
mogilefs_pass $1 {
proxy_pass $mogilefs_path;
proxy_hide_header Content-Type;
proxy_buffering off;
}
}
error_page   500 502 503 504  /50x.html;
location = /50x.html {
root   html;
}
}
}
测试文件浏览




扩展以上的系统



之前的系统容易出现单点故障(nginx),现在增加一台nginx,生产中应该是增加一台物理机,
下面一一介绍具体配置
node4上安装nginx,具体安装,不再描述,node4,node5上的nginx监听端口修改为8080,nginx配置如下(node4,node5)一模一样
[root@node5 nginx]# grep -v "^[[:space:]].*#" nginx.conf |grep -v "^#" |grep -v "^$"
worker_processes  1;
error_log   /var/log/nginx_error.log  notice;
events {
worker_connections  1024;
}
http {
include       mime.types;
default_type  application/octet-stream;
sendfile        on;
keepalive_timeout  65;
upstream mogileserver {
server  172.16.251.22:7001;
server  172.16.251.23:7001;
server  172.16.251.24:7001;
}
server {
listen       8080;
server_name  localhost;
location / {
root   html;
index  index.html index.htm;
}
location ~* ^(/images/.*)$ {
mogilefs_tracker mogileserver;
mogilefs_domain images;
mogilefs_pass $1 {
proxy_pass $mogilefs_path;
proxy_hide_header Content-Type;
proxy_buffering off;
}
}
error_page   500 502 503 504  /50x.html;
location = /50x.html {
root   html;
}
}
}
node5上 haproxy配置文件如下;
[root@node5 haproxy]# grep -v "^[[:space:]].*#" haproxy.cfg |grep -v "^#" |grep -v "^$"
global
log         127.0.0.1 local2
chroot      /var/lib/haproxy
pidfile     /var/run/haproxy.pid
maxconn     4000
user        haproxy
group       haproxy
daemon
stats socket /var/lib/haproxy/stats
defaults
mode                    http
log                     global
option                  httplog
option                  dontlognull
option http-server-close
option forwardfor       except 127.0.0.0/8
option                  redispatch
retries                 3
timeout http-request    10s
timeout queue           1m
timeout connect         10s
timeout client          1m
timeout server          1m
timeout http-keep-alive 10s
timeout check           10s
maxconn                 3000
frontend webservers
bind  *:80
acl url_static path_beg -i /images
acl url_static path_end -i .jpg .gif .png
use_backend static if url_static
backend static
balance roundrobin
server node4 172.16.251.25:8080 check
server node5 172.16.251.24:8080 check
启动node5上的haproxy,nginx,node4上的nginx 如下图:







接下来就可以测试
测试过程,停掉其中一台nginx服务,再进行图片的访问,成功!

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息