检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不同集群类型的NodeLocal DNSCache地址如下: CCE Standard集群:169.254.20.10 CCE Turbo集群:169.254.1.1 创建nginx.yaml文件,示例如下: apiVersion: v1 kind: Pod metadata:
在机器学习场景中,数据集特征定义、版本控制、权限管理、预处理和I/O加速等核心需求缺乏原生支持,迫使数据科学家构建额外工具链。
这有助于降低业务中断时间,提升系统稳定性。 前提条件 已有Standard/Turbo集群,且版本在v1.27及以上。 集群中已有正常运行的NVIDIA GPU节点。
官方文档中,不同产品形态支持的NPU指标不同,CCE Standard/Turbo集群中节点对应产品形态如下: 当节点内NPU卡为Snt3(可登录节点,通过npu-smi info命令查询)时,请关注产品形态为“推理服务器(插Atlas 300I 推理卡)”所支持的NPU指标。
Annotations中的元数据可以是small或large,structured或unstructured,并且可以包括标签不允许使用的字符。
开启告警中心 CCE Standard集群和CCE Turbo集群均支持开启告警中心。 在目标集群左侧导航栏选择“告警中心”。 选择“告警规则”页签,单击“开启告警中心”,在弹出的页面中选择一个或多个联系组,以便分组管理订阅终端并接收告警消息。
ClusterQuotaResource objects 参数解释: 集群配额 约束限制: 不涉及 表5 ClusterQuotaResource 参数 参数类型 描述 type String 参数解释: 资源类型 约束限制: 不涉及 取值范围: cluster:Standard/Turbo
索引:系统会为每个Pod分配索引值,取值为0到实例数-1。每个分配了索引的Pod都执行成功,则Job执行成功。索引模式下,Job中的Pod命名遵循$(job-name)-$(index)模式。 挂起任务:默认任务创建后被立即执行。
Polkit(PolicyKit)是一个用于在类Unix操作系统中控制系统范围权限的组件。pkexec是Plokit框架中的一部分,执行具有提升权限的命令,是sudo的替代方案。请使用Polkit的用户及时安排自检并做好安全加固。
安全设置(可选):对容器权限进行设置,保护系统和其他容器不受其影响。请输入用户ID,容器将以当前用户权限运行。 容器日志(可选):容器标准输出日志将默认上报至 AOM 服务,无需独立配置。您可以手动配置日志采集路径,详情请参见通过ICAgent采集容器日志(不推荐)。
系统会将登录请求重定向到Dex进行身份登录验证。 Dex将身份验证请求转发给第三方身份认证服务(Identity Provider)。 如果用户的凭证通过了第三方身份认证服务的验证,身份认证服务将返回id_token。
系统会以邮件、短信形式给客户发送账户余额变动通知,包括账户余额调整、充值到账、客户在线充值等。 父主题: 计费类
CCE Turbo集群 Autopilot:CCE Autopilot集群 默认取值 为空时默认为CCE Standard,CCE Turbo集群 请求示例 无 响应示例 状态码:200 ok { "kind" : "Addon", "apiVersion" : "v3"
(CCE Standard集群创建nodeport类型Service,Turbo集群创建ClusterIP类型Service) 创建灰度发布的Ingress。关于灰度发布的参数说明请参见参数说明。
CCE Turbo集群 Autopilot:CCE Autopilot集群 默认取值 为空时默认为CCE Standard,CCE Turbo集群 请求示例 无 响应示例 状态码:200 OK { "kind" : "Addon", "apiVersion" : "v3"
前提条件 已有一个CCE Standard或CCE Turbo集群,且集群版本在1.27.16-r20、1.28.15-r10、1.29.10-r10、1.30.6-r10、v1.31.4-r0及以上。
对此,CCE Standard/Turbo集群提供了LeaderWorkerSet插件,这是一种专为AI/ML推理设计的CRD资源,能够更有效地解决在LLM分布式推理场景中Deployment和StatefulSet的局限性。
前提条件 已创建一个集群,且集群有可用节点,具体操作步骤请参见购买Standard/Turbo集群。 集群内节点已绑定弹性公网IP,且已配置kubectl命令行工具,具体请参见将弹性公网IP绑定至实例和通过kubectl连接集群。
请勿对以下CCE系统使用的密钥做任何操作,详情请参见集群系统密钥说明。 请不要操作kube-system下的secrets。 请不要操作任何命名空间下的default-secret、paas.elb。
客户端使用了不配套的HTTPS证书链验证ELB Ingress侧配置的HTTPS证书 通过curl命令测试时报错信息如下: SSL certificate problem: unable to get local issuer certificate 请确保客户端中的HTTPS证书链与