检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作系统版本支持机制 同步机制 云容器引擎CCE发布的集群节点组件会随CCE集群版本发布定期更新。 操作系统重大漏洞修复:跟随集群补丁升级策略发布。 集群版本与操作系统对应关系 如下为当前已经发布的集群版本与操作系统版本的对应关系,请参考: 表1 弹性云服务器-虚拟机节点操作系统 操作系统
可在容器工作负载中作为文件或者环境变量使用。 密钥配置 敏感操作保护 CCE控制台支持敏感操作保护,开启后执行删除集群敏感操作时,系统会进行身份验证,进一步保证CCE的安全性。 敏感操作保护介绍 父主题: 安全
节点paas用户登录权限检查异常处理 检查项内容 检查paas用户是否有登录权限。 解决方案 执行以下命令查看paas用户是否有登录权限: sudo grep "paas" /etc/passwd 如果paas用户权限中带有"nologin"或者"false",说明paas用户没
该方案基于云容器引擎CCE服务构建,可帮助您快速实现业务系统的容器化改造。 CCE、ELB、EIP 基于CCE快速部署Volcano批量调度系统 该解决方案能帮您快速在华为云CCE容器集群上快速部署Volcano批量调度系统。 CCE、EIP 基于Nginx Ingress实现灰度发布
创建时可修改 CCE Standard/CCE Turbo 命令空间 服务所在的命名空间 参数名 取值范围 默认值 是否允许修改 作用范围 namespace 0-63字符 default 创建时可修改 CCE Standard/CCE Turbo 服务访问类型 服务允许指定业务需要的类型
节点命令行检查异常处理 检查项内容 检查节点中是否存在升级所必须的命令。 解决方案 该问题一般由于节点上缺少集群升级流程中使用到的关键命令,可能会导致集群升级失败。 报错信息如下: __error_code#ErrorCommandNotExist#chage command is
K8s组件内存资源限制检查异常处理 检查项内容 检查K8s组件例如etcd、kube-controller-manager等组件是否资源超出限制。 解决方案 方案一:适当减少K8s资源。 方案二:扩大集群规格,详情请参见变更集群规格。 父主题: 升级前检查异常问题排查
如何判断Pod的网卡出现了故障? 运行中的Pod缺少容器eth0网卡。 CCE Turbo集群中的Pod无法正常运行,报错“no eni bound to pod”。 新旧节点IP复用触发社区已知的issue,CCE Turbo集群中DaemonSet类型的Pod的创建时间如果早于对应新No
String 参数解释: 操作系统类型,须精确到版本号。例:Huawei Cloud EulerOS 2.0。具体支持的操作系统请参见节点操作系统说明。 约束限制: 当指定“alpha.cce/NodeImageID”参数时,“os”参数必须和用户自定义镜像的操作系统一致。 取值范围: 不涉及
监控”。 单击“监控”页签顶部的“查看更多”,前往运维管理页面查看历史监控记录。 当节点cpu和内存负载过高时,会导致节点网络时延过高,或系统OOM,最终展示为不可用。 解决方案: 建议迁移业务,减少节点中的工作负载数量,并对工作负载设置资源上限,降低节点CPU或内存等资源负载。
分片部署:对于超大规模模型(如70B参数),通过模型分片和KV Cache分片实现分布式推理。 版本记录 表6 AI推理框架插件版本记录 插件版本 支持的集群版本 更新特性 1.0.0 v1.28 v1.29 v1.30 v1.31 CCE Standard/Turbo集群支持使用AI推理框架插件 父主题: AI服务部署
利用率并降低运维成本。在应对突发资源需求(如在线业务负载激增)时,系统具备智能的资源调度能力,例如通过CPU QoS策略,在线任务可优先获得计算资源,确保关键业务的稳定运行。当内存需求出现短时增长时,底层操作系统会触发自动内存回收机制,优先回收非活跃数据(例如,离线业务的 page
CCE Turbo容器网卡支持固定IP。详情请参见为Pod配置固定IP。 CCE Turbo容器网卡支持自动创建和自动绑定EIP。详情请参见为Pod配置固定EIP。 CCE Turbo集群在离线混部增强:支持Pod网络优先级限制。详情请参见出口网络带宽保障。 CCE Turbo集群
数推荐设置为163790。 此内核参数计算公式如下: CCE Turbo集群&容器隧道网络模型集群: net.ipv4.neigh.default.gc_thresh3 = 单节点容器个数*容器子网可用IP数(Turbo集群多容器子网情况下,取容器子网可用IP数较大值) 举例:当前容器子网为192
系统委托说明 由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系,因此当您首次登录CCE控制台时,CCE将自动请求获取当前区域下的云资源权限,从而更好地为您提供服务。服务权限包括: 计算类服务 CCE集群创建节点时会关联创建云服务器,因此需要获取访问弹性云服务器、裸金属服务器的权限。
未开启“系统预置采集”:如果安装云原生插件后暂未在“配置中心”开启“系统预置采集”,则可以在“配置中心”的ServiceMonitor开启npu-exporter数据采集。 已开启“系统预置采集”:如果安装云原生监控插件后已在“配置中心”中开启“系统预置采集”,则需要在“系统预置采
CCE Turbo容器网卡支持固定IP。详情请参见为Pod配置固定IP。 CCE Turbo容器网卡支持自动创建和自动绑定EIP。详情请参见为Pod配置固定EIP。 CCE Turbo集群在离线混部增强:支持Pod网络优先级限制。详情请参见出口网络带宽保障。 CCE Turbo集群
节点操作系统 集群版本与操作系统对应关系 如下为当前已经发布的集群版本与操作系统版本的对应关系,请参考: 表1 弹性云服务器-虚拟机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型 云原生网络2
通过X509证书连接集群 X509证书是CCE集群中身份验证和通信加密的核心机制。通过X509证书连接集群,能够确保只有经过授权的客户端可以访问集群,同时加密通信数据,防止传输过程中的窃听或篡改,从而保障通信的安全性、身份的真实性以及访问的合法性。如果您需要通过X509证书连接集
规模没有特殊要求的通用场景。 CCE Turbo集群 CCE Turbo集群是基于云原生基础设施构建的云原生2.0容器引擎服务,具备软硬协同、网络无损、安全可靠、调度智能的优势,为用户提供一站式、高性价比的全新容器服务体验。 CCE Turbo集群提供了面向大规模高性能的场景云原生2