检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开启云原生混部 前提条件 已创建一个CCE Standard集群或CCE Turbo集群,且版本满足以下要求: v1.23集群:v1.23.9-r0及以上 v1.25集群:v1.25.4-r0及以上 集群中已安装1.10.0及以上版本的Volcano插件。
负载均衡器配置:监听器配置 对外访问端口 路由对接的负载均衡器对外暴露的访问端口 参数名 取值范围 默认值 是否允许修改 作用范围 k8s annotation: kubernetes.io/elb.port 1-65535 无 允许 CCE Standard/CCE Turbo
检查到使用Snt3NPU卡的节点操作系统为EulerOS 2.8 arm,不支持升级至v1.28及以上版本集群 Standard/Turbo集群v1.28及以上版本不再支持EulerOS 2.8 arm(已EOS),但Snt3 ARM机型最高支持至EulerOS 2.8 arm,因此集群无法直接对节点操作系统进行升级
CCE Standard集群场景) 图3 ELB Ingress工作原理(CCE Turbo集群使用共享型ELB场景) 在使用CCE Turbo集群时,Pod IP直接从VPC中分配,支持使用独享型ELB直接连接Pod。
kubelet性能配置 请求至kube-apiserver的QPS配置 与kube-apiserver通信的qps 参数名 取值范围 默认值 是否允许修改 作用范围 kube-api-qps 大于等于0 100 允许 CCE Standard/CCE Turbo 与kube-apiserver
集群调度器配置 开启GPU共享 是否开启GPU共享能力 参数名 取值范围 默认值 是否允许修改 作用范围 enable-gpu-share true/false true 允许 CCE Standard/CCE Turbo 配置建议: true 默认调度器 集群调度器选择开关,用户可自定义调度器模式
通过配置安全计算模式seccomp,限制容器的系统调用权限,具体配置方法可参考社区官方资料使用 Seccomp 限制容器的系统调用。 通过配置ReadOnlyRootFilesystem的配置,保护容器根文件系统。
调度器性能配置 请求至kube-apiserver的QPS配置 与kube-apiserver通信的qps 参数名 取值范围 默认值 是否允许修改 作用范围 kube-api-qps 大于等于0 100 允许 CCE Standard/CCE Turbo 与kube-apiserver
集群类型对比 集群类型对比 CCE支持多种类型的集群创建,以满足您各种业务需求,如下为集群类型之间的区别,可帮助您选择合适的集群: 集群类型 CCE Standard CCE Turbo CCE Autopilot 产品定位 标准版本集群,提供高可靠、安全的商业级容器集群服务。
CCE Turbo集群: 弹性云服务器-虚拟机:基于弹性云服务器部署容器服务,仅支持可添加多张弹性网卡的机型。 弹性云服务器-物理机:基于擎天架构的服务器部署容器服务。 父主题: 节点
推荐升级的目标补丁版本号,如r0 targetVersions Array of strings 升级目标版本集合 表6 UpgradeFeatureGates 参数 参数类型 描述 supportUpgradePageV4 Boolean 集群升级Console界面是否支持V4
Standard/Turbo集群。
图1 流量镜像 准备工作 已创建2个CCE Standard集群cluster-1和cluster-2,详情请参见购买Standard/Turbo集群。 两个集群中均已安装NGINX Ingress控制器。
存储 对象存储服务 OBS 弹性文件服务 SFS 极速文件存储 SFS Turbo 如果使用对象存储,需要全局设置OBS Administrator权限。
前提条件 已创建一个CCE Standard或CCE Turbo集群,且集群版本满足以下要求: v1.23集群:v1.23.14-r0及以上 v1.25集群:v1.25.9-r0及以上 v1.27集群:v1.27.6-r0及以上 v1.28集群:v1.28.4-r0及以上 其他更高版本的集群
集群删除失败:安全组中存在残留资源 CCE在删除集群时,会连接集群的kube-apiserver查询集群对接的周边资源信息,如Turbo集群对接的弹性网卡/弹性辅助网卡等,当CCE集群的状态为不可用,冻结,休眠等状态时,删除集群有可能会出现查询资源失败而导致集群删除失败的情况。
前提条件 已创建一个CCE Standard或CCE Turbo集群,且集群版本为v1.23及以上。 集群中需提前部署可用的工作负载用于对外提供访问。
(仅CCE Turbo集群可见) 单击“确定”,完成配置操作。
对此,CCE Standard/Turbo集群提供了LeaderWorkerSet插件,这是一种专为AI/ML推理设计的CRD资源,能够更有效地解决在LLM分布式推理场景中Deployment和StatefulSet的局限性。
作用范围 affinity 不配置/亲和节点调度/亲和节点池调度/自定义亲和策略 不配置 允许 CCE Standard/CCE Turbo 不配置:插件实例不指定节点亲和调度。