检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
目前仅华为云/华为账号,或者在admin用户组下的用户支持此操作。 监控数据上报至第三方监控平台:将普罗数据上报至第三方监控系统,需填写第三方监控系统的地址和Token,并选择是否跳过证书认证。 本地数据存储:将普罗数据存储在集群中的PVC存储卷里,选择用于存储监控数据的磁盘类
access)节点访问会导致增加延迟和开销,从而降低系统性能。为此,volcano实现了NUMA亲和性调度策略,尽可能把Pod调度到需要跨NUMA节点最少的工作节点上,这种调度策略能够降低数据传输开销,优化资源利用率,从而增强系统的整体性能。 Volcano的目标是解决调度程序NUMA拓扑感知的限制,以便实现以下目标:
x后Pod无法启动如何解决? CCE AI套件(NVIDIA GPU)插件版本升级或回滚后,如何对GPU节点进行排水? EulerOS 2.9系统安装NVIDIA驱动失败 Volcano调度器插件升级后,Volcano Job(vcjob)资源无法正常运行
若插件版本不再兼容升级后的集群版本,则必须升级插件版本。 若检查发现插件存在配置不一致且需强制升级,您将无法跳过该检查项。需先通过CCE控制台或API重新配置插件参数,确保与系统要求一致后,方可继续升级流程。 父主题: 升级前检查异常问题排查
0-linux-amd64.tar.gz 解压Helm包。 tar -xzvf helm-v2.17.0-linux-amd64.tar.gz 将helm复制到系统path路径下,以下为/usr/local/bin/helm。 mv linux-amd64/helm /usr/local/bin/helm
调度和隔离能力。 前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25.3-r0及以上 操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型 支持Tesla T4、Tesla V100类型的的GPU 驱动版本 GPU虚拟化功能仅支持535
使用内存时的EmptyDir的大小为Pod规格限制值的100%。 不使用内存的EmptyDir不会占用系统内存。 挂载路径 请输入挂载路径,如:/tmp。 数据存储挂载到容器上的路径。请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,
击“创建工作负载”。 在“容器配置 > 基本信息 >NPU配额”中选择“整卡调度”。选择“整卡调度”后,请在下方选择申请的芯片类型和个数,系统将根据该信息为容器分配对应NPU资源。 图1 NPU整卡调度 其他参数请参考创建工作负载进行配置,参数配置完成后,在右下角单击“创建工作负
解析服务 DNS curl -v http://backend:8080 # 测试服务连通性 文件系统检查 场景:主容器日志丢失或配置文件异常。 创建临时容器,挂载主容器的文件系统(共享volumeMounts)。 kubectl debug myapp -it --image=busybox
0-linux-amd64.tar.gz 解压Helm包。 tar -xzvf helm-v3.3.0-linux-amd64.tar.gz 将Helm复制到系统path路径下,以下为/usr/local/bin/helm。 mv linux-amd64/helm /usr/local/bin/helm
请勿删除cce-pause等系统镜像,否则可能导致无法正常创建容器。 方案二:扩容磁盘 扩容磁盘的操作步骤如下: 在EVS控制台扩容数据盘。详情请参见扩容云硬盘容量。 在EVS控制台扩容成功后,仅扩大了云硬盘的存储容量,还需要执行后续步骤扩容逻辑卷和文件系统。 登录CCE控制台,进入
请勿删除cce-pause等系统镜像,否则可能导致无法正常创建容器。 方案二:扩容磁盘 扩容磁盘的操作步骤如下: 在EVS控制台扩容数据盘。详情请参见扩容云硬盘容量。 在EVS控制台扩容成功后,仅扩大了云硬盘的存储容量,还需要执行后续步骤扩容逻辑卷和文件系统。 登录CCE控制台,进入
迁移完成后,节点上用户自定义的资源标签、K8s标签、污点不受影响。 迁移完成后,节点上名为cce.cloud.com/cce-nodepool的系统标签会被删除。如果已有工作负载使用该标签进行亲和/反亲和调度,在Kubelet重启时会将该节点上已存在的Pod停止并重新调度。 将默认节点池中的节点迁移到自定义节点池
会被立即清理。当集群中处于终态(包括Completed和UnexpectedAdmissionError状态)的Pod数量超过1000时,系统将进行集中清理。终态Pod占用的资源已被释放,查询时仅会显示其状态记录,便于后续问题排查和定位。若无需保留此类Pod,可直接手动删除。 父主题:
Admission定义了三种标签,如表2,您可以在某个命名空间中设置这些标签来定义需要使用的Pod安全性标准级别,但请勿在kube-system等系统命名空间修改Pod安全性标准级别,否则可能导致系统命名空间下Pod故障。 表2 Pod Security Admission标签 隔离模式(mode) 生效对象 描述
网络接收丢包率:节点的物理网卡网络接收丢包率。 磁盘相关指标 磁盘读取速率:节点上的每个文件系统在不同的时间段的每秒钟读取的字节数。 磁盘写入速率:节点上的每个文件系统在不同的时间段的每秒钟写入的字节数。 磁盘使用率:节点上的每个文件系统在不同的时间段已使用的空间所占各自总空间的比例。 Pod相关指标 Pod
在该计费模式下,您可以以折扣价购买并使用弹性云服务器,性能与常规云服务器无异。但是当库存资源不足,或市场价格上浮、并超过您的预期价格时,系统会自动释放您的云服务器资源,对这些折扣售卖的弹性云服务器进行中断回收。与“按需计费”和“包年/包月”方式购买的弹性云服务器相比,在提供同等
的目录权限不相同。 umask值用于为用户新创建的文件和目录设置缺省权限。如果umask的值设置过小,会使群组用户或其他用户的权限过大,给系统带来安全威胁。因此设置所有用户默认的umask值为0077,即用户创建的目录默认权限为700,文件的默认权限为600。 可以在启动脚本里面
IaaS、PaaS 和 SaaS 类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API 网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为
内存等核心计算资源。通过资源虚拟化技术,系统可以根据用户需求将这些物理资源灵活划分为多个vNPU,每个vNPU包含特定数量的AICore、AICPU和内存等资源。例如,一个容器申请4个AICore资源,另一个容器申请2个AICore,则系统将创建2个vNPU实例供容器使用,具体流程请参见图1。