搜索_华为云

moondream2基于Lite Server适配PyTorch NPU推理指导 - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备状态。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
云上迁移适配故障 - AI开发平台ModelArts

xxx to use this pandas version” 重装的包与镜像装CUDA版本不匹配创建训练作业提示错误码ModelArts.2763 训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” 系统容器异常退出

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
训练作业卡死重启 - AI开发平台ModelArts

开启作业卡死重启后，只要系统检测到训练卡死，就在容器中重启训练作业，卡死重启不涉及资源调度，因此不会占用“重启次数”。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 模型训练高可靠性
在ModelArts的Notebook中JupyterLab默认工作路径是什么？ - AI开发平台ModelArts

带EVS存储的Notebook实例 JupyterLab文件默认存储路径，为创建Notebook实例时，系统自动分配的EVS空间。在文件列表的所有文件读写操作都是基于所选择的EVS下的内容操作的。使用EVS类型的挂载，可将大数据挂载至“~/work”目录下。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练作业卡死检测定位 - AI开发平台ModelArts

系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示检测到指标异常并持续30分钟则判定作业卡死。如果需要修改卡死检测时间，则可以修改环境变量“MA_HANG_DETECT_TIME”的值，具体操作指导请参见管理训练容器环境变量。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
训练作业卡死检测 - AI开发平台ModelArts

系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示检测到指标异常并持续30分钟则判定作业卡死。如果需要修改卡死检测时间，则可以修改环境变量“MA_HANG_DETECT_TIME”的值，具体操作指导请参见管理训练容器环境变量。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 模型训练高可靠性
请求超时返回Timeout - AI开发平台ModelArts

模型单次预测的时间不能超过40S，超过后系统会默认返回Timeout错误。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
迁移过程使用工具概览 - AI开发平台ModelArts

性能分析工具 msprof命令行工具提供了采集通用命令以及AI任务运行性能数据、昇腾AI处理器系统数据、Host侧系统数据和采集和解析能力。面向推理的场景，可以对于模型的执行性能数据进行收集，可基于收集的性能数据进行性能分析。父主题：推理迁移指导（MindSporeLite）

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 推理迁移指导（MindSporeLite）
编排Workflow - AI开发平台ModelArts

from modelarts import workflow as wf # 定义统一存储对象管理输出目录 output_storage = wf.data.OutputStorage(name="output_storage", description="输出目录统一配置")

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
CogVideoX1.5 5b 和 CogVideoX 5b模型基于Lite Server全量8卡序列并行推理指导（6.5.901） - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备状态。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 视频生成模型训练推理
上传远端文件至JupyterLab - AI开发平台ModelArts

图1 上传文件图标图2 进入远端文件上传界面输入有效的远端文件URL后，系统会自动识别上传文件名称，单击“上传”，开始上传文件。图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例 > 上传文件至JupyterLab
PD分离部署性能调优理论基础 - AI开发平台ModelArts

因此，PD分离系统良好运行的关键在于满足时延SLO约束下，那么面对不同的请求分布，尽可能提高这三种速率。PD配比寻优保持一个原则：使Prefill速率、Decode速率、传输速率三者互不为短板。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
VAR/XAR/RandAR/Infinity自回归图像生成模型基于Lite Server适配NPU推理指导（6.5.905) - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备状态。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 图像生成模型训练推理
上传算法至SFS - AI开发平台ModelArts

cd Swin-Transformer sed -i 's/\r//' run.sh Shell脚本在Windows系统编写时，每行结尾是\r\n，而在Linux系统中行每行结尾是\n，所以在Linux系统中运行脚本时，会认为\r是一个字符，导致运行报错“$'\r': command

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
构建条件节点控制分支执行 - AI开发平台ModelArts

通过获取JobStep输出的相关metric指标信息实现 from modelarts import workflow as wf # 构建一个OutputStorage对象，对训练输出目录做统一管理 storage = wf.data.Storage(name="storage_name

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

原因：系统会将输入管道、输出管道、以及超参添加到启动命令的末尾，如果最后一条命令不是运行训练脚本则会报错。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 准备模型训练代码
Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 shm-size：共享内存大小。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
推理场景介绍 - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

图6 Clone仓库失败如果克隆时遇到Notebook当前目录下已有该仓库，系统给出提示仓库名称重复，此时可以单击“覆盖”继续克隆仓库，也可以单击取消。父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例 > 上传文件至JupyterLab
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 AI Gallery支持将模型进行微调，训练后得到更优模型。场景描述模型微调是深度学习中的一种重要技术，它是指在预训练好的模型基础上，通过调整部分参数，使其在特定任务上达到更好的性能。在实际应用中，预训练模型是在大规模通用数据集上训练得到的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）

总条数： 1497

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消