在前面我们生成了所有kubernetes相关的TLS证书,kubernetes集群自身所有配置相关信息都存储在etcd之中,而flannel也将网络子网网段注册到etcd之中并为集群中节点的pod提供了加入同一局域网的能力。因此接下来我们安装部署etcd集群。
因为flannel插件也依赖于etcd存储信息,所以我们首先需要安装etcd集群,使之实现高可用。
在开始之前请确保在上一篇文章中生成的TLS证书都分发到需要部署的所有机器节点
的以下位置:
/etc/kubernetes/ssl/etcd.pem
/etc/kubernetes/ssl/etcd-key.pem
/etc/kubernetes/ssl/ca.pem
部署etcd
我们采用纯二进制安装etcd,因此不使用默认的包管理器中的安装文件。在每台需要部署的etcd的节点上,通过官方仓库下载你需要的版本的etcd二进制安装包:
下载安装二进制文件
目前最新版本是v3.3.4(截止到我写这篇文章的时候),而kubernetes v1.10验证过的版本为3.1.12
,如果没有特殊需求请尽量使用验证版本(如果你是不升级不舒服斯基当我没说)找到对应的系统架构并直接下载: https://github.com/coreos/etcd/releases/download/v3.1.12/etcd-v3.1.12-linux-amd64.tar.gz
在所有需要安装etcd节点执行以下命令来安装etcd和etcdctl
(注意:etcd目前不支持降级,如果你初始安装版本过高,后续像降级到验证版是比较麻烦的):
1 | wget https://github.com/coreos/etcd/releases/download/v3.1.12/etcd-v3.1.12-linux-amd64.tar.gz |
配置systemd unit
接着,我们需要编辑对应的systemd unit service文件,我们需要新建一个etcd.service
文件并放置于以下路径:/usr/lib/systemd/system/etcd.service
并键入以下内容:
1 | [Unit] |
WorkingDirectory
:指定 etcd 的工作目录和数据目录为/var/lib/etcd
,需在启动服务前创建这个目录。- 为了保证通信安全,需要指定 etcd 的公私钥(cert-file和key-file)、Peers 通信的公私钥和CA证书(peer-cert-file、peer-key-file、peer-trusted-ca-file)、客户端的CA证书(trusted-ca-file)。
--initial-cluster-state
值为new
时,--name
的参数值必须位于--initial-cluster
列表中。- 我们将其中一些参数的设置抽取为环境变量,以便于我们修改参数的时候不需要再次systemctl daemon-reload。
- 带有
--peer-xxx
前缀的配置为etcd与其它etcd节点通信的相关配置,不带有的该前缀的则为客户端(例如:etcdctl)与etcd节点(作为服务器)通信的相关配置。
对应的,我们在/etc/etcd/etcd.conf
路径中新建一个etcd.conf
文件并键入以下内容:
1 | # [member] |
- 这是节点IP为10.138.148.161的环境变量配置文件内容,对于其他节点,修改对应的
ETCD_NAME
为对应的node1、node2、node3,并将ETCD_INITIAL_ADVERTISE_PEER_URLS
和ETCD_INITIAL_ADVERTISE_PEER_URLS
修改为对应的节点的ip
。 - 此处需要特别说明的是:
ETCD_CLUSTER_NODE_LIST
中的ip必须在生成etcd TLS证书时在etcd-csr.json
中的hosts
字段中指定(Subject Alternative Name(SAN)),否则可能会得到(error "remote error: tls: bad certificate", ServerName "")
这样的错误。 - 所有需要加入的节点都需要在
ETCD_CLUSTER_NODE_LIST
中指定,并正确配置其ETCD_NAME
。
验证etcd安装
在所有的节点上完成了上述两步之后,我们分别执行以下命令来启动etcd(初始可能会阻塞一段时间):
1 | sudo systemctl daemon-reload |
如果配置正确,那么上述命令执行结果应该是任何输出的。如果结果有错,请参照上述配置和环境变量文件检查配置。一旦我们顺利启动etcd
服务,我们还需要正确检查我们的etcd
集群是否可用,在etcd
集群中任一节点中执行以下命令:
1 | etcdctl --endpoint https://127.0.0.1:2379 \ |
在一切正常情况下,你会得到类似如下的输出结果:
1 | member 245a74588a3e85d0 is healthy: got healthy result from https://xxx.xxx.xxx.xxx:2379 |
后记
需要特别说明的是:etcd
集群是否和kubernetes
部署在同样的服务器节点上是可选的
。也就是说etcd
集群可以脱离kubernetes
部署的集群而单独部署在其他单独的服务器上,且并不需要和kubernetes
节点数对应。经过我的实践如果有条件的话请务必:
- 将etcd部署在kubernetes的Node节点之外负载比较低的服务器节点上。
- etcd的集群数量尽量为奇数,以确保某些情况下部分etcd节点挂掉的选举问题。
至此,我们的etcd
集群已经顺利安装完成。接下来安装flannel插件。