检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练脚本说明 训练脚本参数说明 不同模型推荐的参数与NPU卡数设置 训练tokenizer文件说明 父主题: Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导(6.3.912)
准备工作 准备资源 准备数据 准备权重 准备代码 准备镜像 父主题: Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.912)
准备镜像 镜像方案说明 ECS获取基础镜像 ECS中构建新镜像 ECS中上传新镜像 父主题: 准备工作
常见错误原因和解决方法 显存溢出错误 网卡名称错误 联网下载SimSun.ttf时可能会遇到网络问题 在运行finetune_ds.sh 时遇到报错 父主题: Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.912)
计费项(ModelArts Studio) ModelArts Studio(MaaS)模型推理计费项 ModelArts Studio(MaaS)模型调优计费项 ModelArts Studio(MaaS)模型压缩计费项
续费 续费概述 手动续费 自动续费
历史文档待下线 套餐包
Lite Server资源配置 Lite Server资源配置流程 配置Lite Server网络 配置Lite Server存储 配置Lite Server软件环境
Lite Server资源管理 查看Lite Server服务器详情 启动或停止Lite Server服务器 同步Lite Server服务器状态 切换或重置Lite Server服务器操作系统 制作Lite Server服务器操作系统 Lite Server资源热备 退订Lite Server资源
Lite Server超节点管理 Lite Server超节点扩容 Lite Server超节点定期压测 开启超节点HCCL通信算子级重执行机制 授权修复Lite Server超节点
Lite Server插件管理 安装Lite Server AI插件 升级Lite Server中的昇腾驱动固件版本 Lite Server节点故障诊断 Lite Server节点一键式压测
配置Lite Server软件环境 NPU服务器上配置Lite Server资源软件环境 GP服务器上配置Lite Server资源软件环境 父主题: Lite Server资源配置
Lite Server资源使用 LLM/AIGC/数字人基于Server适配NPU的训练推理指导 NPU日志收集上传
Lite Cluster资源配置 Lite Cluster资源配置流程 配置Lite Cluster网络 配置kubectl工具 配置Lite Cluster存储 (可选)配置驱动 (可选)配置镜像预热
Lite Cluster资源使用 在Lite Cluster资源池上使用Snt9B完成分布式训练任务 在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 在Lite Cluster资源池上使用Snt9B完成推理任务 在Lite Cluster资源池上使用Ascend
监控Lite Cluster资源 使用AOM查看Lite Cluster监控指标 使用Prometheus查看Lite Cluster监控指标 父主题: Lite Cluster资源管理
Lite Cluster插件管理 Lite Cluster插件概述 节点故障检测(ModelArts Node Agent) AI套件(Ascend NPU) Volcano调度器 集群弹性引擎
Server使用ECS服务器时不支持重装操作系统,部分区域使用裸金属服务器时也不支持重装操作系统,如果您想重装操作系统,您可通过切换操作系统的方式解决。更多信息,请参见Server使用前须知。 ModelArts Lite Server服务器重装或者切换操作系统后,对应的EVS系统盘ID发生变化,和下单时订单中的EVS
模型管理 模型调试 导入模型 查询模型列表 查询模型对象列表 查询模型详情 删除模型
导出任务管理 查询导出任务列表 创建导出任务 查询导出任务状态 父主题: 数据管理