检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
EulerOS 2.9系统安装NVIDIA驱动失败 Volcano调度器插件升级后,Volcano Job(vcjob)资源无法正常运行
需先通过CCE控制台或API重新配置插件参数,确保与系统要求一致后,方可继续升级流程。 父主题: 升级前检查异常问题排查
若未指定,系统将自动为Pod分配可用的NPU节点。
tar -xzvf helm-v2.17.0-linux-amd64.tar.gz 将helm复制到系统path路径下,以下为/usr/local/bin/helm。
前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25.3-r0及以上 操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型 支持Tesla T4、Tesla V100类型的的GPU 驱动版本 GPU虚拟化功能仅支持535.216.03、470.57.02
不使用内存的EmptyDir不会占用系统内存。 挂载路径 请输入挂载路径,如:/tmp。 数据存储挂载到容器上的路径。请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。
# 查看进程树 ps aux # 监控资源使用 top -H # 跟踪系统调用 strace -p 1 # PID 1 为 Nginx 主进程 父主题: 容器
tar -xzvf helm-v3.3.0-linux-amd64.tar.gz 将Helm复制到系统path路径下,以下为/usr/local/bin/helm。 mv linux-amd64/helm /usr/local/bin/helm 查看Helm版本。
调整文件系统的大小。其中/dev/vgpaas/dockersys为容器引擎的文件系统路径。
当集群中处于终态(包括Completed和UnexpectedAdmissionError状态)的Pod数量超过1000时,系统将进行集中清理。终态Pod占用的资源已被释放,查询时仅会显示其状态记录,便于后续问题排查和定位。若无需保留此类Pod,可直接手动删除。
调整文件系统的大小。其中/dev/vgpaas/dockersys为容器引擎的文件系统路径。
迁移完成后,节点上名为cce.cloud.com/cce-nodepool的系统标签会被删除。如果已有工作负载使用该标签进行亲和/反亲和调度,在Kubelet重启时会将该节点上已存在的Pod停止并重新调度。
图2 Deployment 一个Deployment可以包含一个或多个Pod副本,每个Pod副本的角色相同,所以系统会自动为Deployment的多个Pod副本分发请求。
系统会提前发出即将释放云服务器资源的通知。 父主题: 计费模式
否则可能导致系统命名空间下Pod故障。
磁盘相关指标 磁盘读取速率:节点上的每个文件系统在不同的时间段的每秒钟读取的字节数。 磁盘写入速率:节点上的每个文件系统在不同的时间段的每秒钟写入的字节数。 磁盘使用率:节点上的每个文件系统在不同的时间段已使用的空间所占各自总空间的比例。
如果umask的值设置过小,会使群组用户或其他用户的权限过大,给系统带来安全威胁。因此设置所有用户默认的umask值为0077,即用户创建的目录默认权限为700,文件的默认权限为600。
使用应用资源推荐 开通完成后,为工作负载开启资源推荐能力,开启后系统将根据推荐结果直接修改工作负载的资源申请值和限制值。 推荐结果基于工作负载历史运行数据生成,可能存在偏差,仅做参考。请基于应用实际运行情况调整资源申请值。
根据系统提示进行删除操作。系统内置的命名空间不支持删除。 父主题: 命名空间
典型漏洞利用场景: 攻击者具有集群工作负载的创建或更新权限,创建工作负载时设置容器进程的WORKDIR为/proc/self/fd/<num>,以实现在容器运行后访问节点文件系统。