检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
登录CCE控制台,单击集群名称进入集群详情页。 在左侧导航栏中选择“配置中心”,并切换至“监控运维配置”页签,修改采集配置。 已开启“系统预置采集”:云原生监控插件预置了部分组件的采集策略,您可以单击系统预置采集下的“管理”,开启kube-apiserver、kube-controller、kube-sche
登录CCE控制台,进入集群。 单击节点池后“更多 > 配置管理”。 图1 节点池配置管理 修改kubelet配置参数,在“允许使用的不安全系统配置”中增加配置“[net.core.somaxconn]”。 图2 修改kubelet参数 方式二:直接修改节点kubelet参数(不推荐)
s-injection=enabled标签,默认:true。命名空间添加标签后会识别命名空间的创建请求并自动添加标签,这些操作的目标不包含系统内置的命名空间(如kube-system)。 multiAZEnable 否 bool 插件中deployment组件多可用部署是否采用强
IPv4私网地址检查异常处理 检查历史升级记录是否满足升级条件 检查集群管理平面网段是否与主干配置一致 CCE AI套件(NVIDIA GPU)插件检查异常处理 节点系统参数检查异常处理 残留packageversion检查异常处理 节点命令行检查异常处理 节点交换区检查异常处理 NGINX Ingress控制器插件升级检查异常处理
本地临时卷挂载 参数 参数说明 容量 申请的存储卷容量大小。 挂载路径 请输入挂载路径,如:/tmp。 数据存储挂载到容器上的路径。请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,请确保目录下无影响容器启动的文件,否则文件会被
Node 节点纳管失败 NodeInstallFailed 次要 检查集群纳管节点是否成功。 Node 节点操作系统内核故障 KernelOops 次要 检查节点操作系统内核是否故障。 Node 节点内存不足强杀进程 OOMKilling 次要 节点上的Pod内存使用超过Limit值导致进程终止。
个容器使用过多内存从而影响本节点其他容器。由于内存是不可压缩资源,一旦超过Limit限制则会触发操作系统OOM导致容器重启,所以业务容器化后需要关注容器内存使用率指标。 操作系统以memory_limit_in_bytes值作为某cgroup可使用内存上限,当某个cgroup内存
io/subnetid=fd43acad-33e7-48b2-a85a-24833f362e0e os.architecture=amd64 os.name=EulerOS_2.0_SP5
在指定的这段时间内一直处于不需要的状态时,CCE集群弹性引擎插件才会考虑对其进行缩容操作。这样可以避免因资源的短暂波动而频繁触发缩容,增强系统的稳定性。如果未设置该参数,CCE集群弹性引擎插件会使用默认的时间阈值。 10分钟 在弹出的确认窗口中单击“保存”,即可成功下发配置。 步骤三:验证自定义缩容条件是否生效
available、nodefs.inodesFree、imagefs.available 或 imagefs.inodesFree 节点的根文件系统或镜像文件系统上的可用磁盘空间和 inode 已满足驱逐条件。 您可以扩容节点磁盘空间,详情请参见存储扩容。 PIDPressure node.kubernetes
含一个节点,因此可以实现单个节点级别的负载亲和性调度。 如果指定标签为kubernetes.io/os,此时标签值为节点的操作系统类型,则将不同操作系统的节点划分为不同的拓扑域,此时一个拓扑域中可能包含多个节点,因此可以将多个节点作为一个整体进行负载亲和性调度。 例如,某个拓扑域
(可选)在“编辑YAML”窗中,单击“下载”,可下载该YAML文件。 回退(仅无状态工作负载可用) 所有无状态工作负载的发布历史记录都保留在系统中,您可以回退到指定的版本。 登录CCE控制台,进入一个已有的集群,在左侧导航栏中选择“工作负载”。 选择“无状态负载”页签,单击待回退工作负载后的“更多
)组成,长度范围1-56位,且不能以中划线(-)结尾。 取值范围: 不涉及 默认取值: 不涉及 policyId String 参数解释: 权限ID。 约束限制: 系统自动生成,该值不可修改。 取值范围: 不涉及 默认取值: 不涉及 clusters Array of strings 参数解释: 集群ID
集群诊断场景 诊断项 是否需要开通监控中心 修复方案 CoreDNS域名解析插件状态 CoreDNS域名解析插件状态 否 CoreDNS域名解析插件是系统必装的资源插件,为集群提供域名解析服务。插件未安装或者异常将影响集群整体业务响应,影响范围大。需前往插件市场,安装插件或者检查插件状态。
_bytes Gauge 进程驻留内存大小(以字节为单位) process_cpu_seconds_total Counter 进程用户和系统 CPU 总时间(以秒为单位) go_goroutines Gauge 协程数量 父主题: 仪表盘
因此集群中的工作负载节点亲和策略应避免使用如下节点标签:node.kubernetes.io/subnetid、os.architecture、os.name、os.version。 配置节点池弹性伸缩策略 在CCE控制台,单击集群名称进入集群。 单击左侧导航栏的“节点管理”,
开通监控中心前,用户需要使用具有admin用户组的账户完成对CCE及其依赖服务的委托授权。 授权方式:监控中心页面自动弹出“确认授权”页面,用户单击“确认授权”按钮后系统自动完成授权。所授予的权限类型请参考云原生观测委托权限说明。 约束与限制 集群版本仅支持v1.17及以上。 使用监控中心前,用户需要使用具
单”,将不需要上报的事件添加至黑名单进行管理,其中“事件名称”可通过CCE事件列表查询。 普通事件上报:开启后,会将普通事件上报至AOM,系统默认配置了部分需要上报的普通事件。如果您需要自定义上报的事件,可以单击“配置白名单”,将需要上报添加至白名单进行管理,其中“事件名称”可通过CCE事件列表查询。
您已经创建好一个集群,并且在该集群中安装CCE容器存储(Everest)。 您已经创建好一块云硬盘,并且云硬盘满足以下条件: 已有的云硬盘不可以是系统盘、专属盘或共享盘。 云硬盘模式需选择SCSI(购买云硬盘时默认为VBD模式)。 云硬盘的状态可用,且未被其他资源使用。 云硬盘的可用区需
应用场景 表4 应用场景不同 云容器引擎CCE 云容器实例CCI 适用所有场景,一般运行大规模长期稳定的应用,例如: 电商 业务中台 IT系统 适用于有明显的波峰波谷特征的场景,灵活申请资源,提高资源利用率。例如: 批量计算 高性能计算 突发扩容 CI/CD测试 图2 CCE和CCI应用场景区别