第一次接触ceph集群,感谢官方的指导文档和许多网友提供的教程,糊糊涂涂算是把集群部署起来了。由于Luminous12.2刚发布不久,部署起来跟旧版本还是有些许差别,所以以此做下笔记也给需要的人做下参考。
Ps. 刚开始接触ceph的同学,十分建议先把官方文档看一遍。
1. Ceph介绍
Ceph 是一个高性能、可靠、可扩展的开源存储平台。它是一个自由的分布式存储系统,提供了对象、块和文件级存储的接口,并可以不受单点故障的影响而运行。
Ceph集群结构:
- (1)Ceph Admin-管理节点,用来安装ceph-deploy 进行ceph部署使用,基本上大部分操作都在这台机器上。
- (2)Ceph OSD (ceph-osd) - 控制数据存储,数据复制和恢复。Ceph 集群需要至少两个 Ceph OSD 服务器。这次安装中我们将使用三个 Ubuntu 服务器。
- (3)Ceph Monitor (ceph-mon) - 监控集群状态并运行 OSD 映射 和 CRUSH 映射。这里我们使用一个服务器。
- (4)Ceph Meta Data Server (ceph-mds) - 如果你想把 Ceph 作为文件系统使用,就需要这个。
2. OS系统
Ubuntu 16.04.3
3. Ceph 版本
Ceph v12.2 Luminous
4. 设置固定IP和修改主机名(所有节点)
-
(1)设置对应的固定IP(每个节点分别设置)
192.168.31.131 admin_server 192.168.31.132 mon_server 192.168.31.133 osd_server_1 192.168.31.134 osd_server_2
- (2)修改/etc/hostname,修改为对应的主机名
-
192.168.31.132 mon_server 192.168.31.133 osd_server_1 192.168.31.134 osd_server_2
5. 修改apt源(所有节点)
deb http://mirrors.163.com/ubuntu/ xenial main restricted universe multiverse deb http://mirrors.163.com/ubuntu/ xenial-security main restricted universe multiverse deb http://mirrors.163.com/ubuntu/ xenial-updates main restricted universe multiverse deb http://mirrors.163.com/ubuntu/ xenial-backports main restricted universe multiverse ## 测试版源 deb http://mirrors.163.com/ubuntu/ xenial-proposed main restricted universe multiverse ## 源码 deb-src http://mirrors.163.com/ubuntu/ xenial main restricted universe multiverse deb-src http://mirrors.163.com/ubuntu/ xenial-security main restricted universe multiverse deb-src http://mirrors.163.com/ubuntu/ xenial-updates main restricted universe multiverse deb-src http://mirrors.163.com/ubuntu/ xenial-backports main restricted universe multiverse ##测试版源 deb-src http://mirrors.163.com/ubuntu/ xenial-proposed main restricted universe multiverse
- (2)更新
sudo apt-get update sudo apt-get install
6. OS环境配置(所有节点)
- (1)安装ntp:用于同步所有节点的日期和时间
sudo apt-get install ntp
- (2)安装SSH: 用于admin控制其它节点
sudo apt-get install openssh-server
7. 创建ceph用户(所有节点)
sudo useradd -d /home/cephuser -m cephuser sudo passwd cephuser echo "cephuser ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/cephuser sudo chmod 0440 /etc/sudoers.d/cephuser
8. 安装ceph apt key(admin节点)
- (1)安装key(使用163源)
wget -q -O- 'http://mirrors.163.com/ceph/keys/release.asc' | sudo apt-key add - echo deb http://mirrors.163.com/ceph/debian-luminous/ $(lsb_release -sc) main | sudo tee /etc/apt/sources.list.d/ceph.list
- (2)安装ceph-deploy
sudo apt-get update && sudo apt-get install -y ceph-deploy
9. 创建ssh信任(admin)
- (1)生成公钥
ssh-keygen
(全按回车键,默认)
Generating public/private key pair. Enter file in which to save the key (/ceph-admin/.ssh/id_rsa): Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /ceph-admin/.ssh/id_rsa. Your public key has been saved in /ceph-admin/.ssh/id_rsa.pub.
ssh-copy-id cephuser@mon_server ssh-copy-id cephuser@osd_server_1 ssh-copy-id cephuser@osd_server_2
Host mon_server Hostname mon_server User cephuser Host osd_server_1 Hostname osd_server_1 User cephuser Host osd_server_2 Hostname osd_server_2 User cephuser
10. 开始创建集群(admin)
- (1)使用ceph-deploy部署。 首先需要创建工作环境,该环境会保存所有的配置文件:
mkdir ~/my-cluster cd ~/my-cluster
- (2)创建集群,其中mon_server是monitor节点,执行该命令会生成ceph配置文件、monitor密钥文件以及日志文件。
ceph-deploy new mon_server
- (3)修改默认冗余份数(此参数只有当OSD节点小于3的时候才需要修改,默认的冗余份数是3,如果是2节点需要设置为2,如果osd节点大于2,则此步骤省略),修改ceph.conf文件,第一个参数2是副本数量,第二个2000是 日志大小约为2G,在[global]下增加以下内容:
osd pool default size = 2 osd journal size = 2000
- (4)配置网卡和网络(OSD节点单网卡请忽略)
OSD节点是双网卡,因此需要设置使用的网卡和网络地址
修改ceph.conf文件,在[global]下增加以下内容:
public network = 192.168.31.0/24 cluster network = 10.10.100.0/24
- (5)开始安装ceph
注:因为CFW的问题,管理节点ceph-Deploy前Ceph镜像源修改非常重要,这里采用了网易镜像
export CEPH_DEPLOY_REPO_URL=http://mirrors.163.com/ceph/debian-luminous/ export CEPH_DEPLOY_GPG_URL=http://mirrors.163.com/ceph/keys/release.asc
- (6)在所有节点开始安装ceph
ceph-deploy install admin_server mon_server osd_server_1 osd_server_2
- (7)初始化mon节点和收集密钥信息
ceph-deploy mon create-initial
执行完毕,目录应该有以下文件:
{cluster-name}.client.admin.keyring {cluster-name}.bootstrap-osd.keyring {cluster-name}.bootstrap-mds.keyring {cluster-name}.bootstrap-rgw.keyring
完成以上步骤,安装完成,但还没有配置osd节点。
- (8) 配置osd节点
lsblk命令查看磁盘结构,假设选择的是/dev/sdb(使用虚拟机的话,可以添加磁盘)
格式化对应的磁盘:
ceph-deploy disk zap osd_server_1:sdb ceph-deploy disk zap osd_server_2:sdb
以上步骤会清空磁盘的所有数据。 接下来创建osd,注意由于我们只是测试,故没有使用单独的磁盘作为journal,实际在生产环境下,需要配备SSD分区作为journal,能够最大化IO吞吐量。
ceph-deploy osd create osd_server_1:sdb ceph-deploy osd create osd_server_2:sdb
ceph-deploy admin admin_server mon_server osd_server_1 osd_server_2 sudo chmod +r /etc/ceph/ceph.client.admin.keyring # 保证具有读取的密钥的权限
(10)配置mgr
运行ceph health
,打印:HEALTH_WARN no active mgr
自从ceph 12开始,manager是必须的。应该为每个运行monitor的机器添加一个mgr,否则集群处于WARN状态。(具体可以参考Luminous的release日志)
在mon_server上创建名称为mon_mgr的mgr服务ceph-deploy mgr create mon_server:mon_mgr
查看状态:
hcy@admin_server:~/my-cluster$ ceph health HEALTH_OK hcy@admin_server:~/my-cluster$ ceph -s cluster: id: 7981a8fc-378d-4564-95cf-e464d46bdd38 health: HEALTH_OK services: mon: 1 daemons,quorum mon_server mgr: mon_mgr(active) osd: 2 osds: 2 up,2 in data: pools: 0 pools,0 pgs objects: 0 objects,0 bytes usage: 2108 MB used,28409 MB / 30517 MB avail pgs:
- (11)访问dashboard
启用dashboard(mon_server节点)
ceph mgr module enable dashboard
通过 http://192.168.31.132:7000 访问dashboard
dashboard的port默认为7000,可以执行ceph config-key set mgr/dashboard/server_port $PORT
修改port。
也可以执行ceph config-key set mgr/dashboard/server_addr $IP
指定dashboard的访问IP。
至此Ceph的集群搭建算是完成了,下一步会进行块设备的搭建。
参考:
CEPH 分布式存储部署手册 (Ubuntu 14.04)
如何在 Ubuntu 16.04 中安装 Ceph 存储集群
CentOS7.2部署Luminous版Ceph-12.2.0