集群列表简介
登录翼MapReduce控制台后,可查看账号下拥有的集群列表和当前的集群状态。
集群状态
集群包含的状态如下表所示。
状态 | 说明 |
启动中 | 集群正在创建中,可以查看具体的进程。 |
运行中 | 集群创建成功且集群中组件状态处于正常运行中,集群正在正常运行。 |
异常终止 | 集群启动失败或因为异常原因而终止,可以查看失败原因。 |
释放中 | 表示集群正在退订。 |
已终止 | 集群已经到期15天以上或者集群已经完成退订。 |
已冻结 | 已经到期的集群,资源会保留15天,此时状态为已冻结。 |
查看集群状态
集群创建完成后,登录翼MapReduce控制台后,可查看账号下所有集群列表和集群状态。
在“我的集群”中,显示所有您创建过的集群,默认页面上最多显示10条集群信息,当您集群数量较多时,可以修改页面右下角当前页面最多显示的集群条数,也可以翻页进行查看。
集群列表参数说明:
参数 | 参数说明 |
集群名称 | 用户自己定义的集群名称。 |
集群类型 | 用户创建集群时选择的集群类型。 |
付费类型 | 默认为包年包月。 |
状态 | 集群当前的状态信息。 |
创建时间 | 集群创建的时间。 |
查看集群基本信息
登录翼MapReduce控制台后,进入集群列表页面,点击需要查看集群的名称,即进入集群基本信息界面。
集群基本信息参数主要包括集群信息、软件信息和网络硬件。
集群信息
参数 | 说明 |
集群名称 | 集群的名称,单击“编辑”可对集群名称进行修改。 |
创建时间 | 集群创建的时间。 |
运行时间 | 集群运行的时间。 |
到期时间 | 集群到期时间。 |
高可用 | 默认开启。 |
付费类型 | 默认包年包月。 |
Kerberos认证 | 根据业务场景需要,默认开启。 |
软件信息
参数 | 说明 |
产品版本 | 集群使用的翼MapReduce版本。 |
软件信息 | 集群创建时使用的组件及其版本号。单击需要查看的组件名称,可以进入该组件详情信息。 |
业务场景 | 集群创建时选择的业务场景。 |
网络硬件
参数 | 说明 |
区域集群 | 集群所在的区域。 |
硬件配置 | 集群所有节点MASTER、CORE、TASK(如有)的硬件信息。 |
VPC ID | 集群所使用VPC的ID,单击 |
安全组ID | 集群所使用安全组的ID,单击 |
管理组件和主机监控
用户在日常使用中,可以在翼MR Manager管理所有组件(含角色实例)和主机的状态及指标信息:
• 状态信息,包含运行、健康及角色实例状态统计。
• 指标信息,各组件的主要监控指标项。
管理组件监控
1. 在翼MR Manager页面,点击左侧菜单栏“集群服务”。
2. 在集群服务列表点击任一集群进入。
3. 选择“集群状态”页,展示实例分组健康状态。
状态 | 描述 |
告警 | 集群实例服务曾出现过异常。 |
故障 | 集群实例服务产生故障。 |
正常 | 集群实例服务已启动。 |
未监控 | 集群实例未安装prometheus,服务未监控。 |
4. 点击任一实例的健康状态后,跳转到角色实例页面,按实例分组显示每个实例组件角色,主机IP,主机名称,主机状态,启动状态和健康状态。
管理主机监控
1. 在翼MR Manager页面,点击左侧菜单栏“主机”。
2. 主机页展示主机IP、主机名称、初始化状态、主机状态、健康状态、主机标签、内存、CPU型号、主机配置、操作系统、描述等字段。
3. 健康状态栏,展示主机健康状态。
状态 | 描述 |
告警 | 集群实例服务曾出现过异常。 |
故障 | 集群实例服务产生故障。 |
正常 | 集群实例服务已启动。 |
未监控 | 集群实例未安装prometheus,服务未监控。 |
4. 点击主机IP,跳转到主机状态信息栏,展示主机状态、实例列表和告警历史。
5. 点击告警历史,可追溯该主机IP下的历史告警。