检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
io/os 节点操作系统类型。 node.kubernetes.io/subnetid 节点所在子网的ID。 os.architecture 表示节点处理器架构。 例如:amd64,表示AMD64位架构的处理器 os.name 节点的操作系统名称。 os.version 操作系统节点内核版本。
基于GPU监控指标配置工作负载弹性伸缩 在Standard/Turbo集群中,用户可以通过GPU监控指标为使用GPU资源的工作负载配置弹性伸缩(HPA),使应用在业务高峰期自动扩容、低负载时缩容,从而优化资源利用率并降低成本。 前提条件 目标集群已创建,且集群中包含GPU节点,并已运行GPU相关业务。
X协议,若需开启HTTP2功能,可通过控制台配置和通过kubectl命令行配置。 前提条件 已创建一个CCE Standard或CCE Turbo集群,且集群版本满足以下要求: v1.23集群:v1.23.13-r0及以上版本 v1.25集群:v1.25.8-r0及以上版本 v1
白名单:指定的IP允许访问,而其它IP不能访问。 黑名单:指定的IP不能访问,而其它IP允许访问。 前提条件 已创建一个CCE Standard或CCE Turbo集群,且集群版本满足以下要求: v1.23集群:v1.23.12-r0及以上版本 v1.25集群:v1.25.7-r0及以上版本 v1
说明: Annotations不用于标识和选择对象。Annotations中的元数据可以是small或large,structured或unstructured,并且可以包括标签不允许使用的字符。 可通过加入"cluster.install.addons.external/install":
级参数配置完成后,将进入正式升级流程,对插件、控制节点、用户节点依次进行升级。 在升级控制节点之前,系统会自动保存节点池的弹性伸缩配置并关闭弹性伸缩功能。待控制节点升级完成后,系统将自动恢复节点池的弹性伸缩功能。因此,在升级控制节点过程中无法弹性伸缩节点,升级完控制节点之后即可恢
之间的资源忙等待和死锁等痛点问题,大幅度提升整体训练性能。 前提条件 已创建v1.19及以上版本的集群,详情请参见购买Standard/Turbo集群。 已安装Volcano插件,详情请参见Volcano调度器。 组调度介绍 Gang调度策略是volcano-scheduler的
为您提供丰富的图表和面板,用于实时监控、分析和可视化各种指标和数据源。 Prometheus(停止维护) Prometheus是一套开源的系统监控报警框架。在云容器引擎CCE中,支持以插件的方式快捷安装Prometheus。 云原生异构计算插件 插件名称 插件简介 CCE AI套件(NVIDIA
23及以上集群版本支持Egress规则操作系统。 CCE Turbo集群中,v1.27.16-r10、v1.28.15-r0、v1.29.10-r0、 v1.30.6-r0及以上版本的集群开启DataPlane V2后支持Egress规则,仅支持HCE OS 2.0操作系统。 场景一:通过网络策略限制Pod只能访问指定地址
在右侧找到容器垂直弹性引擎插件,单击“安装”。 在安装插件页面,根据需求选择“规格配置”。 选择“系统预置规格”时,您可根据集群Pod数量选择“小规格”、“中规格”或“大规格”,系统会根据不同的预置规格配置插件的实例数及资源配额,具体配置值请以控制台显示为准。 选择“自定义规格”
available、nodefs.inodesFree、imagefs.available 或 imagefs.inodesFree 节点的根文件系统或镜像文件系统上的可用磁盘空间和 inode 已满足驱逐条件。 您可以扩容节点磁盘空间,详情请参见存储扩容。 PIDPressure node.kubernetes
8 arm,且该操作系统已EOS,具体请参见镜像停止服务与支持计划。 Standard/Turbo集群v1.28及以上版本不再支持EulerOS 2.8 arm,如需在v1.28及以上集群中使用NPU资源,请参考集群版本与操作系统对应关系和NPU卡与操作系统对应关系,选择兼容的NPU资源,具体的购买流程请参见Lite
k8s annotation: kubernetes.io/elb.port 1-65535 无 允许 CCE Standard/CCE Turbo 负载均衡器对外端口: 取值范围:1~65535。 部分端口为高危端口,默认被屏蔽,如21端口。 配置建议: 同集群的路由支持对接到相同的监听器
16GiB 操作系统:Huawei Cloud EulerOS 2.0 弹性公网IP:为节点自动创建EIP,可访问公网拉取镜像。 CCE集群 本示例中共有2个CCE集群,包括测试集群和生产集群。 关键配置如下,非关键配置可根据需求自行设置或设为默认值。 集群类型:CCE Turbo集群
策略成功触发后,在此缩容/扩容冷却时间内,不会再次触发缩容/扩容,目的是等待伸缩动作完成后在系统稳定且集群正常的情况下进行下一次策略匹配。 伸缩配置 该设置仅在1.25及以上版本的集群中显示。 系统默认:采用社区推荐的默认行为进行负载伸缩,详情请参见社区默认行为说明。 自定义:自定义扩
volume vgpaas/dockersys successfully resized. 调整文件系统的大小。其中/dev/vgpaas/dockersys为容器引擎的文件系统路径。 resize2fs /dev/vgpaas/dockersys 回显如下: Filesystem
在云原生网络2.0下,支持为StatefulSet工作负载或直接创建的Pod分配固定的公网IP(EIP)。 约束限制 仅以下指定版本的CCE Turbo集群支持用户配置Pod固定EIP: v1.19集群:v1.19.16-r20及以上版本 v1.21集群:v1.21.10-r0及以上版本
给Pod绑定弹性公网IP,可以通过为Pod配置固定弹性公网IP实现,请参见为Pod配置固定EIP。 通过NAT网关访问公网 支持 支持 支持 下面内容以CCE Turbo集群为例,讲解如何通过NAT网关访问公网。NAT网关能够为VPC内的容器实例提供源网络地址转换服务,即SNAT(Source Network
S和Worker可以利用本机网络提供传输效率,缩短训练时间。 Volcano批量调度系统:加速AI计算的利器 Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台,它弥补了Kubernetes在机器学习、深度学习、
net.caffemodel' net = caffe.Net(model_def, # defines the structure of the model model_weights, # contains the trained