搜索_华为云

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

filesystem NFS挂载的文件系统。 mount_point NFS的挂载点。 Diagnos cid GPU所在节点所属的CCE集群ID。 node_ip GPU所在节点的IP。 pool_id 物理专属池对应的资源池ID。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

选择Operating System、Architecture、Distribution、Version、Installer Type后，会生成对应的安装命令，复制安装命令并运行即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

表2 模型镜像版本名称版本 CANN cann_8.0.rc1 PyTorch pytorch_2.1.0 PyTorch_npu 2.1.0.post3-20240413 Step1 检查系统环境 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
上传文件夹至OBS - AI开发平台ModelArts

上传文件夹至OBS 示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参考Session鉴权。 1 2 3 from modelarts.session import Session session = Session

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
SFT全参微调任务 - AI开发平台ModelArts

SFT全参微调任务前提条件 SFT全参微调使用的数据集为alpaca_data数据，已经完成数据处理，具体参见SFT全参微调数据处理。原始的HuggingFace权重，已将原始的HuggingFace权重转换为Megatron格式，具体参见SFT全参微调权重转换启动训练脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
查找和收藏资产 - AI开发平台ModelArts

查找和收藏资产 AI Gallery共享了算法、Notebook代码样例、数据集、镜像、模型、Workflow等多种AI资产，为了方便快速搜索相关资产，提供了多种快速搜索方式以及收藏功能，提升资产的查找效率。搜索资产在各类资产模块页面，通过如下几种搜索方式可以提高资产的查找效率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的vscode-server，根据Commit码和Notebook实例镜像架构下载。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载父主题： AI应用管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务场景描述本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
预训练数据处理 - AI开发平台ModelArts

预训练数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。 Alpaca数据处理说明数据预处理脚本preprocess_data.py存放在代码包的“llm_train/AscendSpeed/ModelLink/tools”目录中，脚本样例命令及参数详解如下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
无法导入模块 - AI开发平台ModelArts

无法导入模块问题现象 ModelArts训练作业导入模块时日志报错： Traceback (most recent call last):File "project_dir/main.py", line 1, in <module>from module_dir import module_file

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
预训练数据处理 - AI开发平台ModelArts

预训练数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。这里以Qwen-14B为例，对于Qwen-7B和Qwen-72B，操作过程与Qwen-14B相同，只需修改对应参数即可。 Alpaca数据处理说明数据预处理脚本preprocess_data.py

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：建议使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
语言模型推理性能测试 - AI开发平台ModelArts

单条请求性能测试针对openai的/v1/completions以及/v1/chat/completions两个非流式接口，请求体中可以添加可选参数"return_latency"，默认为false，若指定该参数为true，则会在相应请求的返回体中返回字段"latency"，返回内容如下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
终止训练作业 - AI开发平台ModelArts

表42 Resource 参数参数类型描述 policy String 训练作业资源规格模式，可选值如下：“regular”、“economic”、“turbo”。 flavor_id String 训练作业选择的资源规格ID。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

推理部署安全责任提供商底层ecs相关的系统补丁修复 k8s的版本更新和漏洞修复虚拟机OS的版本生命周期维护 ModelArts推理平台自身的安全合规性容器应用服务加固模型运行环境的版本更新和漏洞定期修复客户侧资源的授权，访问控制保证应用的供应链安全，依赖和自身的安全性

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全

总条数： 1324

上一页
1
...
40
41
42
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

上传文件夹至OBS - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

查找和收藏资产 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线