搜索_华为云

场景介绍 - 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

您所在企业的华为方技术支持。提示：本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

您所在企业的华为方技术支持。提示：本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
不同机型的对应的软件配套版本 - AI开发平台ModelArts

提交工单联系CCE技术支持进行问题的排查和解决。裸金属服务器的对应的软件配套版本表1 裸金属服务器类型卡类型 RDMA网络协议操作系统适用范围、约束依赖插件 NPU ascend-snt9b RoCE 操作系统：EulerOS 2.10 64bit（推荐）内核版本：4

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
更新网络资源 - AI开发平台ModelArts

Abnormal：网络连接不正常表19 sfsTurboStatus 参数参数类型描述 sfsId String SFS Turbo的ID。 name String SFS Turbo的名称。 status String 与SFS Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3_Darknet53算法训练后部署在线服务报错问题现象使用AI市场物体检测YOLOv3_Darknet53算法进行训练，将数据集切分后进行部署在线服务报错，日志如下：TypeError: Cannot interpret feed_dict key

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

return_dict: Optional[bool] = None, ) return_dict = return_dict if return_dict is not None else self.config.use_return_dict

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
执行训练任务【旧】 - 执行训练任务 - AI开发平台ModelArts

Turbo挂载配置，并选择用户创建的SFS Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径 /home/ma-user/work/ 存储位置：输入用户的“子目录挂载”路径。如果默认没有填写，则忽略。图4 选择SFS Turbo 作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配MindSpeed-LLM PyTorch NPU训练指导（6.5.901） > 执行训练任务
模型推理代码编写说明 - AI开发平台ModelArts

signature_def in signature_defs: signature.append(signature_def) if len(signature) == 1: model_signature = signature[0]

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
执行训练任务【旧】 - 执行训练任务 - AI开发平台ModelArts

Turbo挂载配置，并选择用户创建的SFS Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径 /home/ma-user/work/ 存储位置：输入用户的“子目录挂载”路径。如果默认没有填写，则忽略。图4 选择SFS Turbo 作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在ModelArts Studio（MaaS）配置模型服务接口地址时需要注意什么格式问题？ - AI开发平台ModelArts

单击“调用说明”。使用商用服务：单击“商用服务”页签，在已开通商用服务右侧的操作列，单击“调用说明”。在“调用说明”页面，获取调用该服务所需要的模型服务接口地址。方式二：使用我的服务。在ModelArts Studio（MaaS）控制台左侧导航栏，单击“在线推理”。在“在线推理”页面，单击“我的服务”页签。

帮助中心 > AI开发平台ModelArts > 常见问题 > ModelArts Studio（MaaS）
如果模型服务的RPM数值为300，可以1秒直接发送300个请求吗？ - AI开发平台ModelArts

如果模型服务的RPM数值为300，可以1秒直接发送300个请求吗？不可以。如果模型服务的RPM（每分钟请求数）为300，意味着每秒最多可以处理5个请求（300/60=5）。因此，1秒内发送300个请求会远远超出服务的处理能力，导致请求失败。建议您均匀地发送API请求，避免短时

 帮助中心 > AI开发平台ModelArts > 常见问题 > ModelArts Studio（MaaS）
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

对，则可以跳过此步骤： ssh-keygen -t rsa 将公钥添加到远程服务器的授权文件中，注意替换服务器IP以及容器的端口号： cat ~/.ssh/id_rsa.pub | ssh root@服务器IP -p 容器端口号 "mkdir -p ~/.ssh && cat >>

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源配置 > 配置Lite Server软件环境
场景介绍 - 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
推理特性列表 - AI开发平台ModelArts

当前版本只支持使用llm-compressor工具的W8A8量化和AWQ量化 Lora Adapters 参考vllm介绍使用 _ _ Structured Outputs 参考vllm介绍使用Structured Outputs --guided-decoding-backend=xgrammar _ Tool Calling

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 支持的推理特性
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

示完成在线服务创建。本案例适用于CPU规格，节点规格需选择CPU。如果有免费CPU规格，可选择免费规格进行部署（每名用户限部署一个免费的在线服务，如果您已经部署了一个免费在线服务，需要先将其删除才能部署新的免费在线服务）。图7 部署模型完成服务部署后，返回在线服务页面列表页，

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
迁移流程 - AI开发平台ModelArts
迁移流程 - AI开发平台ModelArts

场景介绍本文介绍如何将客户已有的PyTorch训练业务迁移到昇腾设备上运行并获得较好的模型训练效果。华为云ModelArts针对该场景提供了系统化的迁移指导，包括迁移原理、迁移流程以及迁移后的精度调试及性能调优方法介绍。此外，ModelArts提供了即开即用的云上集成开发环境，包含

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 训练迁移指导（PyTorch）
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linu

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？当模型配置文件中定义了具体的端口号，例如：8443，创建模型没有配置端口，或者配置了其他端口号，均会导致服务部署失败。您需要把模型中的端口号配置为8443，才能保证服务部署成功。修改默认端口号，具体操作如下：登

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
使用GPU A系列裸金属服务器有哪些注意事项？ - AI开发平台ModelArts

使用GPU A系列裸金属服务器有哪些注意事项？使用华为云A系列裸金属服务器时有如下注意事项： nvidia-fabricmanager版本号必须和nvidia-driver版本号保持一致，可参考安装nvidia-fabricmanager方法。 NCCL必须和CUDA版本相匹配，可单击此处可查看配套关系和安装方法。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server

总条数： 1972

上一页
1
...
17
18
19
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消