以下各表分别描述了各组件在操作与维护阶段,进行日常操作时应注意的高危操作。
集群高危操作
操作名称 | 操作风险 | 风险等级 | 规避措施 | 重大操作 观察项目 |
绑定弹性公网IP | 该操作会将集群服务的相关主节点如: Doris FE所在的master节点 暴露在公网,会增大来自互联网的网络 攻击风险可能性。 | ★★★★★ | 请确认绑定的弹性公网IP为可信任的公网访问IP, 确认是否针对开放的相关端口进行设置安全组规则, 只允许可信的IP可以访问该端口, 入方向规则不推荐设置允许0.0.0.0可以访问。 | 无 |
开放集群22端口安全组规则 | 该操作会增大用户利用22进行漏洞攻击的风险。 | ★★★★★ | 针对开放的22端口进行设置安全组规则, 只允许可信的IP可以访问该端口, 入方向规则不推荐设置允许0.0.0.0可以访问。 | 无 |
删除集群或删除集群数据 | 该操作会导致数据丢失。 | ★★★★★ | 删除前请务必再次确认该操作的必要性, 同时要保证数据已完成备份。 | 无 |
缩容集群 | 该操作会导致数据丢失。 | ★★★★★ | 缩容前请务必再次确认该操作的必要性, 同时要保证数据已完成备份。 | 无 |
卸载磁盘或格式化数据盘 | 该操作会导致数据丢失。 | ★★★★★ | 操作前请务必再次确认该操作的必要性, 同时要保证数据已完成备份。 | 无 |
翼MR Manager高危操作
操作名称 | 操作风险 | 风险等级 | 规避措施 | 重大操作观察项目 |
修改日志级别 | 如果修改为DEBUG,会导致Manager 运行速度明显降低。 | ★★ | 修改前确认操作的必要性,并及时修改回默认设定。 | 无 |
重启下层服务时, 如果勾选同时重启上层服务 | 该操作会导致上层服务业务中断, 影响集群的管理维护和业务。 | ★★★★ | 操作前确认操作的必要性,操作时确保 同一时间无其它管理维护操作。 | 观察是否有未恢复的告警产生, 观察集群的管理维护是否正常, 业务是否正常。 |
重启服务 | 重启过程中会中断服务,勾选同时重启上层服务 会导致依赖该服务的上层服务中断。 | ★★★ | 操作前确认重启的必要性。 | 观察是否有未恢复的告警产生, 观察集群的管理维护是否正常, 业务是否正常。 |
修改节点SSH默认端口 | 修改默认端口(22)将导致创建集群、添加服务/实例、 添加主机、重装主机等功能无法正常使用, 并且会导致集群健康检查结果中节点互信等检查项不准确。 | ★★★ | 执行相关操作前将SSH端口改回默认值。 | 无 |