搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --tokenizer：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 推理服务性能评测
准备数据 - 准备工作 - AI开发平台ModelArts

"system": "系统提示词（选填）", "tools": "工具描述（选填）" } ] 上传数据到指定目录将下载的原始数据存放在/mnt/sfs_turbo/training_data目录下。具体步骤如下：进入到/mnt/sfs_turbo/目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
场景介绍 - Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

先联系您所在企业的华为方技术支持。本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制适配的CANN版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
自定义脚本代码示例 - AI开发平台ModelArts

signature_defs: signature.append(signature_def) if len(signature) == 1: model_signature = signature[0]

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

确定带宽服务器A：服务端从mlx4_0网卡接收数据 ib_write_bw -a -d mlx5_0 服务器B：客户端向服务端mlx4_0网卡发送数据。 ib_write_bw -a -F 服务器A的IP -d mlx5_0 --report_gbits 图1 服务器A执行结果

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
GPU A系列裸金属服务器没有任务但GPU被占用如何解决 - AI开发平台ModelArts

GPU A系列裸金属服务器没有任务但GPU被占用如何解决问题现象服务器没有任务，但GPU显示被占用。截图示例如下：图1 显卡运行状态处理方法 nvidia-smi -pm 1 父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

ModelArts服务的常用依赖服务的权限。系统策略 ModelArts对其他云服务有依赖关系，因此在ModelArts控制台的各项功能需要配置相应的服务权限后才能正常查看或使用，依赖服务及其预置的权限如下。表2 ModelArts控制台依赖服务的角色或策略控制台功能依赖服务需配置角色/策略数据管理（数据集/

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

云上挂载路径 Notebook中挂载SFS后，SFS默认在“/home/ma-user/work”路径下。在创建训练作业时，设置SFS Turbo的“云上挂载路径”为“/home/ma-user/work”，使得训练环境下SFS也在“/home/ma-user/work”路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
创建生产训练作业（新版页面） - AI开发平台ModelArts

支持添加多种存储挂载方式，以提高数据的访问效率。添加拓展存储SFS Turbo配置当ModelArts和SFS Turbo间网络直通时，训练作业支持挂载多个SFS Turbo存放训练数据。 “文件系统”：选择一个SFS Turbo。 “云上挂载路径”：输入SFS Turbo对应在训练容器内的云上挂载路径。不

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

Call to connect returned Connection refused, retrying”，则表示NCCL无法找到通信网卡或者是无法正常访问IP地址。需要排查训练代码中是否有设置NCCL_SOCKET_IFNAME环境变量，该环境变量由系统自动注入，训练代码中无需设置。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
场景介绍 - 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
配置IAM权限 - AI开发平台ModelArts

创建自定义策略时，建议将项目级云服务和全局级云服务拆分为两条策略，便于授权时设置最小授权范围。此处的“Policy1”为项目级云服务、“Policy2”为全局级云服务。了解更多。将自定义策略授权给开发者用户组user_group。在统一身份认证服务控制台的左侧菜单栏中，选择“用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
场景介绍 - 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 大模型&AIGC待下线案例 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
准备数据 - 准备工作 - AI开发平台ModelArts

"conversation_id": 1, "meta_instruction": "", "num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配MindSpeed-LLM PyTorch NPU训练指导（6.5.901） > 准备工作
准备数据 - 准备工作 - AI开发平台ModelArts

"conversation_id": 1, "meta_instruction": "", "num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
查询专属资源池列表 - AI开发平台ModelArts

4096, "allocatable_gpus" : 0.5 } ] } 状态码状态码描述 200 服务部署规格列表。错误码请参见错误码。父主题：服务管理

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
内存不足如何处理？ - AI开发平台ModelArts

太小，无法满足应用部署，请增大内存规格。运行中服务告警中出现该提示，可能代码有问题导致内存溢出或者业务使用量太大导致内存需求增多。处理方法在部署或升级在线服务时，选择更大内存规格的计算节点。图3 选择计算节点规格运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询推理VPC访问通道信息的API - AI开发平台ModelArts

参数类型描述 vpcep_service_id String VPC访问通道vpcep终端节点服务ID。 vpcep_service_name String VPC访问通道vpcep终端节点服务名称。 service_port Integer VPC访问通道的端口。状态码：401 表6

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

shape:", text_features.shape) image_features /= image_features.norm(dim=-1, keepdim=True) text_features /= text_features.norm(dim=-1,

帮助中心 > AI开发平台ModelArts > 最佳实践 > 图像生成模型训练推理
准备镜像环境 - AI开发平台ModelArts

出替换命令。 /mnt/sfs_turbo 为宿主机中默认挂载SFS Turbo的工作目录，目录下存放着训练所需代码、数据等文件。同样，/mnt/sfs_turbo 也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1979

上一页
1
...
21
22
23
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消