检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
\"requestsMem\":\"512Mi\"}],\"size\":\"small\",\"category\":[\"CCE\",\"Turbo\"]}}},{\"addonTemplateName\":\"everest\"}]" } }, "spec": { "category":
S密钥是否有效 如果以上排查思路仍无法解决您的问题,请提交工单寻找客服人员协助您进行定位。 排查项一:安全组是否被修改 登录控制台,选择“服务列表 > 网络 > 虚拟私有云 VPC”,单击左侧导航栏的“访问控制 > 安全组”,找到集群控制节点的安全组。 控制节点安全组名称为:集群名称-cce-control-编号。
} ], "category": [ "CCE", "Turbo" ] }, "custom": { "annotations": {},
tyGroup)和集群容器网络配置(NetworkAttachmentDefinition)中的安全组。 前提条件 您已创建一个CCE Turbo集群,且集群版本满足以下要求: v1.23集群:v1.23.16-r0及以上版本 v1.25集群:v1.25.11-r0及以上版本 v1
bel,如果有,值为1,如果节点上没有,值为0。 前提条件 已创建v1.19.16及以上版本的集群,具体操作请参见购买Standard/Turbo集群。 集群中已安装1.11.5及以上版本的Volcano插件,具体操作请参见Volcano调度器。 配置Volcano节点池软亲和调度策略
连接集群。 kubectl安装成功后,执行如下命令授予集群权限。 # 创建服务账号 kubectl create serviceaccount spark # 将集群角色spark-role和上一步创建服务账号绑定,并指定default命名空间授予edit的clusterrole权限
更多信息请参见Kubernetes控制节点上的CPU管理策略。 影响范围 开启了CPU管理策略的集群。 解决方案 登录CCE节点(弹性云服务器)并删除cpu_manager_state文件。 删除命令示例如下: rm -rf /mnt/paas/kubernetes/kubel
cannot be created in this CCE version. 当前CCE版本不支持创建该类型的操作系统。 请参考返回的message,使用支持的操作系统。 400 CCE.01400019 Insufficient resource tenant quota. 资源租户配额不足。
S和Worker可以利用本机网络提供传输效率,缩短训练时间。 Volcano批量调度系统:加速AI计算的利器 Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台,它弥补了Kubernetes在机器学习、深度学习、
txt 然后查看容器所在节点的nvidia驱动版本支持的cuda版本范围,是否包含容器中的cuda版本。 相关链接 工作负载异常:GPU节点部署服务时报错 父主题: 节点运行
网段规划建议 在集群网络构成中介绍集群中网络地址可分为集群网络、容器网络、服务网络三块,在规划网络地址时需要从如下方面考虑: 三个网段不能重叠,否则会导致冲突。且集群所在VPC下所有子网(包括扩展网段子网)不能和容器网段、服务网段冲突。 保证每个网段有足够的IP地址可用。 集群网段的IP地
git_url script { build_tag = sh(returnStdout: true, script: 'git rev-parse --short HEAD').trim()
storageClassName 极速文件存储支持的卷类型,当前支持efs-standard、efs-performance(目前SFS Turbo不支持动态创建,所以此参数后续没有使用)。 spec.claimRef.apiVersion 固定值"v1"。 spec.claimRef
为默认的基于节点资源用量的算法。 通过CCE控制台,创建一个redis工作负载作为示例,并绑定一个“节点访问”类型的服务。 通过以下命令,对刚发放的Redis服务施加负载,模拟业务负载变化的场景。 ./redis-benchmark -h <node_ip> -p 32293 -t
轮转证书文件数量检查 检查项内容 检查您节点上的证书数量过多(>1000),由于升级过程中会批量处理证书文件,证书文件过多可能导致节点升级过慢,节点上Pod被驱逐等。 解决方案 方案一:优先建议您重置节点,详情请参考重置节点。 方案二:修复节点上证书轮转异常问题。 登录节点,并进入节点证书目录。
无 无 允许 - 标签是资源对象的一种附加标识,可以通过标签进行过滤查询 配置建议: 用户按需将一些查询和管理维度(如密钥所属业务领域、微服务等)抽象为标签,方便对配置项进行过滤查询 父主题: 密钥
超高IO 高IO 云硬盘最大容量(GiB) 系统盘:1024 数据盘:32768 系统盘:1024 数据盘:32768 系统盘:1024 数据盘:32768 系统盘:1024 数据盘:32768 系统盘:1024 数据盘:32768 系统盘:1024 数据盘:32768 最大IOPS
请参见存储概述。 docker、containerd的日志文件配置maxSize和maxFile。 更新配置需要重启docker服务或kubelet服务,请谨慎操作。 containerd容器引擎的节点池 登录CCE控制台。 单击集群名称进入集群,在左侧选择“节点管理”,在右侧选择“节点池”页签。
储元数据,因此大量的命名空间可能会导致集群控制平面的资源紧张,影响集群稳定性。 性能限制 对于集群控制平面来说,大量的命名空间会增加API服务器的负载,降低其响应速度。例如,在查询所有命名空间的资源时需要遍历更多的数据,导致集群性能下降。 因此,在实际使用过程中,建议根据需求合理
作用的集群类型 取值范围: CCE:CCE Standard集群 Turbo:CCE Turbo集群 Autopilot:CCE Autopilot集群 默认取值 为空时默认为CCE Standard,CCE Turbo集群 请求示例 无 响应示例 状态码:200 OK { "kind"