关键字:

集群、部署、图形化界面、升级、人大金仓、KingbaseES

环境

编号

硬件型号

软件操作系统

IP

备注

1

CPU:Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz

内存:256GB

磁盘:4TB HDD

CentOS Linux release 7.5.1804

10.12.2.14

主节点

x86

2

CPU:Hygon C86 7380 32-core Processor @ 2.20GHz 128cores

内存:512GB

磁盘:5.2T 7T SSD

Kylin Linux Advanced Server release V10 (Lance)

10.12.96.15

备节点

x86

安装数据库并启动图形化界面

安装数据库

  1. 获取安装包(.iso包)wget+安装包地址(FTP中获取),需要注意的是,获取的安装包与使用的机器的CPU架构要能对应上
  1. 切换至root用户,并进行挂载。
  2. 切换到挂载目录下,执行"sh setup.sh"(图形化安装),然后按步骤安装数据库。

启动集群部署图形化界面

  1. 切换到集群部署工具所在目录:

  1. 启动图形化界面:./deploy

【注意】 不可以切换用户,否则会提示启动失败。例如,当用root用户登录机器,切换到sn用户,并执行"./deploy"时,图形化界面无法打开,如下图所示。

另外,其他可能导致图形化界面无法打开的原因还有:环境不支持GUI/mobaxterm没有设置X11转发/linux没开X11等等。

部署集群

创建项目

右击“项目集群名称” → 点击“创建项目” → 输入项目名称project → 点击“OK” → 项目创建成功

创建集群

  1. 右击“project” → 点击 “创建集群” → 输入集群名称cluster1 → 选择“通用机” → 将常规用户改为自己的用户sn(端口号不需要修改) → 点击“下一步”进入集群配置填写界面

【注意】 常规用户一定要进行修改,最好修改成本人的用户。如果使用默认的kingbase用户,那么在后面部署集群的检查过程中,就会出现"ERROR:[Data Dictionary] already exists"这一错误,就无法继续执行部署了。

  1. 基本设置中,点击选择数据库zip包右边的“选择”按钮 → 选择“db.zip” → 修改“listener Port”(使用默认的54321也可以) → 添加“trusted_servers” → 进入“高级设置”进行配置 → 点击“确定” → 集群通用配置填写完成

部署主节点

  1. 右击“节点管理” → 点击 “新增节点” → 进入ssh配置页面 → 输入节点IP地址"10.12.2.14"和root密码 → 选择“securecmd”文件 → 点击“下一步”进入节点配置界面

  1. 输入“显示名称(node1)” → 选择“License文件”(路径根据实际情况选择)→ 点击“下一步” → 等待一会 → 进入节点环境检测界面

  1. 点击“检查” → 查看“环境参数信息”,确定有没有出现ERROR → 没有出现ERROR点击“下一步”(如果出现ERROR,那么需要先确定问题所在,把ERROR解决后,再次执行前2步)→ 确认“预览信息”无误后,点击“确定” → 进入节点node1部署界面

  1. 点击“部署” → 等待 → 出现“节点部署成功”提示 → 点击“确定” → 点击“关闭” → 完成主节点部署

【注意】如果出现问题,会提示部署失败,也会给出错误原因,此时需要分析错误原因,修改问题,然后点击“重新部署”。

部署备节点

  1. 右击“节点管理” → 点击 “新增节点” → ssh配置页面 → 选择“使用已部署的securecmd”→ 点击“下一步”进入节点配置界面

  1. 输入“显示名称 (node2) ” → 输入“IP地址 (10.12.96.15) ” → 选择“License文件”(路径根据实际情况选择)→ 点击“下一步” → 等待一会 → 进入节点环境检测界面

  1. 点击“检查” → 查看“环境参数信息”,确定有没有出现ERROR → 没有出现ERROR点击“下一步”(如果出现ERROR,那么需要先确定问题所在,把ERROR解决后,再次执行前2步)→ 确认“预览信息”无误后,点击“确定” → 进入节点node2部署界面

  1. 点击“部署” → 等待 → 出现“节点部署成功”提示 → 点击“确定” → 点击“关闭” → 完成备节点部署

集群版本升级

  1. 停集群

cd /home/sn/cluster/project/cluster1/kingbase/bin–切换到安装路径下

./sys_monitor.sh stop–停集群(只需要停主集群)

  1. 备份主备节点数据,分别在主备节点备份安装目录下的bin、lib、share目录以及data目录(如果数据已经备份则可不再备份),建议备份数据的目录与之前的目录不在同一个目录

–10.12.2.14和10.12.96.15都需要执行如下操作

cd /home/sn/cluster/project/cluster1/kingbase

mkdir -p /home/sn/data_bak–新建存储备份的目录

cp -r ./data/ /home/sn/data_bak–备份数据,如果已有备份,则不再备份

cp -r bin lib share /home/sn/data_bak–备份bin、lib、share

  1. 替换主节点和所有备节点版本包(一般出的包为:kingbase-server-linux-xxx.tar)

–10.12.2.14和10.12.96.15都需要执行如下操作(需要先获取升级版本的tar包)

/*进入程序所在目录,解压缩覆盖旧的程序的lib、bin、share目录*/

tar xf kingbase-server-V008R006C006M001B0011-linux-x86_64.tar -C ./

  1. 对补丁包进行解压覆盖完成后,需要将旧的程序的bin目录下的如lac.conf、chk.conf等配置文件拷贝到新的程序的bin目录下,具体根据现场对哪些配置文件有修改而定。同样也是所有主备节点都需要操作。

–10.12.2.14和10.12.96.15都需要执行如下操作

cd /home/sn/cluster/project/cluster1/kingbase

cp /home/sn/data_bak/bin/lac.conf ./bin/

cp /home/sn/data_bak/bin/chk.conf ./bin/

  1. 主备节点用root账号修改arping权限,分别在主备节点用root用户做如下操作:

–10.12.2.14和10.12.96.15都需要执行如下操作

cd /home/sn/cluster/project/cluster1/kingbase/bin

su root

chown root:root arping && chmod u+s arping

  1. 所有节点启动集群

–10.12.2.14和10.12.96.15都需要执行如下操作

cd /home/sn/cluster/project/cluster1/kingbase/bin

./sys_monitor.sh start

  1. 查看升级后的版本号是否正确

–10.12.2.14和10.12.96.15都需要执行如下操作

cd /home/sn/cluster/project/cluster1/kingbase/bin–进入升级后的bin目录

./kingbase -V–查看服务端程序kingbase的版本是否正确

  1. 检查集群状态是否正常

–主节点(10.12.2.14)执行

cd /home/sn/cluster/project/cluster1/kingbase/bin–进入升级后的bin目录

./repmgr cluster show

./ksql -p 54330 -U system test–端口号为前面部署时设置的,3.2节创建集群

test=# select * from sys_stat_replication;

test=# select * from sys_replication_slots;

集群版本回退

参考资料