搜索_华为云

vllm_single_node.yaml - AI开发平台ModelArts

vllm_single_node.yaml vllm_single_node.yaml文件用于单机部署推理服务。用户可修改的字段详情见基于K8s Deployment单机部署推理服务中的步骤1：配置模型及镜像参数。 apiVersion: apps/v1 kind: Deployment

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 附录
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

获取待上传的文件名获取待上传的文件在服务器的绝对路径。上传单个文件在服务器执行如下命令，可以将服务器上的文件上传到AI Gallery仓库里面。 gallery-cli upload {repo_id} {文件名} 如下所示，表示将服务器上的文件“D:\workplace\

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
AI Gallery使用流程 - AI开发平台ModelArts

Gallery中的模型部署为AI应用。发布后的资产，可通过微调大师训练模型和在线推理服务部署模型，具体可参见使用AI Gallery微调大师训练模型、使用AI Gallery在线推理服务部署模型。图1 AI Gallery使用流程 AI Gallery也支持管理从Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
推理特性列表 - AI开发平台ModelArts

当前版本只支持使用llm-compressor工具的W8A8量化和AWQ量化 Lora Adapters 参考vllm介绍使用 _ _ Structured Outputs 参考vllm介绍使用Structured Outputs --guided-decoding-backend=xgrammar _ Tool Calling

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 支持的推理特性
Llama-Factory - AI开发平台ModelArts
Llama-Factory - AI开发平台ModelArts

Llama-Factory 本章节主要描述训练所需的yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。 yaml文件配置根据以下步骤修改yaml文件。表1 模型训练脚本参数参数示例值参数说明 backend_config.training.dataset

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.906） > 训练服务配置说明 > 参数配置说明
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

ModelArts服务软件开发工具包（ModelArts SDK）是对ModelArts服务提供的REST API进行的Python封装，以简化用户的开发工作。用户直接调用ModelArts SDK即可轻松管理数据集、启动AI训练以及生成模型并将其部署为在线服务。 ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
Standard专属资源池 - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？ ModelArts训练专属资源池如何与SFS弹性文件系统配置对等连接？

帮助中心 > AI开发平台ModelArts > 常见问题
更新Notebook实例 - AI开发平台ModelArts

参数解释：支持的存储类型。不同存储类型的差异，详见开发环境中如何选择存储。取值范围：枚举类型，取值如下： SFS：弹性文件服务 EVS：云硬盘 OBS：对象存储服务 OBSFS：并行文件系统 EFS：弹性文件服务（SFS Turbo） mount_path String 参数解释：存储挂载至Notebook实例的目

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

systemctl status buildkitd 若buildkitd的服务运行状态如下图所示，则表示服务运行成功。使用Ctrl+C即可退出查看状态。 Step2 获取推理镜像建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 containerd

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
云上迁移适配故障 - AI开发平台ModelArts

2763 训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” 系统容器异常退出父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
MindSpeed-LLM - AI开发平台ModelArts
MindSpeed-LLM - AI开发平台ModelArts

MindSpeed-LLM 本章节主要描述训练所需的yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。 yaml文件参数配置根据以下步骤修改yaml文件。数据集选择：以下参数二选一，详解如下。参数示例值参数说明 backend_config.preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.906） > 训练服务配置说明 > 参数配置说明
VeRL - AI开发平台ModelArts
VeRL - AI开发平台ModelArts

VeRL 本章节主要描述训练所需的yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。 yaml文件配置根据以下步骤修改yaml文件，以下参数aaa.bbb为aaa区域的bbb参数值，如backend_config.data.train_files指backend_config区域中data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.906） > 训练服务配置说明 > 参数配置说明
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

训练完成后，可先在开发环境Notebook中创建本地模型，在开发环境Notebook调试完成后再部署到推理服务上。只支持使用ModelArts Notebook部署本地服务。示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的S

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
MindSpeed-RL - AI开发平台ModelArts
MindSpeed-RL - AI开发平台ModelArts

MindSpeed-RL 本章节主要描述训练所需的yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。 yaml文件参数配置根据以下步骤修改yaml文件。数据集选择：以下参数二选一，详解如下。参数示例值参数说明 backend_config.preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.906） > 训练服务配置说明 > 参数配置说明
Reasoning Outputs - AI开发平台ModelArts

Reasoning Outputs与structured_outputs和tool_calling不兼容。不支持请求参数stop和stop_token_ids，当前版本会导致思考过程被提前截断。启动Reasoning Outputs功能在启动服务时添加如下命令。 --enable-reasoning

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 支持的推理特性
ECS获取基础镜像 - AI开发平台ModelArts

ECS获取基础镜像 Step1 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。 Step2 创建镜像组织在SWR服务页面创建镜像组织。图1 创建镜像组织

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
Lite Cluster高危操作一览表 - AI开发平台ModelArts

当您在CCE、ECS或BMS服务控制台直接操作ModelArts Lite Lite Cluster资源时，可能会导致资源池部分功能异常。下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster使用前必读
ECS获取和上传基础镜像 - 准备镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建镜像组织在SWR服务页面创建镜像组织。图1 创建镜像组织 Step2 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录如图所示。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > LLM大语言模型训练历史版本文档 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
ECS获取和上传基础镜像 - 准备镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建镜像组织在SWR服务页面创建镜像组织。图1 创建镜像组织 Step2 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录如图所示。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > LLM大语言模型训练历史版本文档 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像

总条数： 1964

上一页
1
...
25
26
27
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消