搜索_华为云

准备环境 - 准备工作 - AI开发平台ModelArts

delArts Lite Server 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
准备环境 - 准备工作 - AI开发平台ModelArts

delArts Lite Server 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

04内核自动升级？场景描述在Ubuntu 20.04每次内核升级后，系统需要重新启动以加载新内核。如果您已经安装了自动更新功能，则系统将自动下载和安装可用的更新，这可能导致系统在不经意间被重启，如果使用的软件依赖于特定版本的内核，那么当系统自动更新到新的内核版本时，可能会出现兼容性问题。在使用Ubuntu20

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

e_id}/apis/{api_id} 表1 路径参数参数是否必选参数类型描述 service_id 是 String 服务编号，可通过查询服务列表获取。 api_id 是 String APP编号。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train.sh 启动SDXL LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_sdxl_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 图像生成模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
准备环境 - 准备工作 - AI开发平台ModelArts

odelArts Lite Server支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配MindSpeed-LLM PyTorch NPU训练指导（6.5.901） > 准备工作
准备环境 - 准备工作 - AI开发平台ModelArts

delArts Lite Server 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备环境 - 准备工作 - AI开发平台ModelArts

odelArts Lite Server支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
准备环境 - 准备工作 - AI开发平台ModelArts

delArts Lite Server 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询APP的API认证信息 - AI开发平台ModelArts

APP：APP认证 IAM：IAM认证 predict_url String 预测地址。 service_id String 服务编号。 service_name String 服务名称。 support_app_code Boolean 是否支持APP CODE。请求示例无响应示例状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

自定义镜像的制作要求用户对容器相关知识有比较深刻的了解，除非订阅算法和预置框架无法满足需求，否则不推荐使用。自定义镜像需上传至容器镜像服务（SWR），才能用于ModelArts Standard上训练。上传镜像到SWR服务中，具体操作请参见如何登录并上传镜像到SWR。自定义镜像的启动命令规范用户遵循ModelAr

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 准备模型训练代码
使用kv-cache-int8量化 - 推理模型量化 - AI开发平台ModelArts

ype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8_pertensor #只支持int8，表示kvint8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
训练作业进程异常退出 - AI开发平台ModelArts

问题现象训练作业运行失败，日志中出现如下类似报错： [Modelarts Service Log]Training end with return code: 137 原因分析日志显示训练进程的退出码为137。训练进程表示用户的代码启动后的进程，所以这里的退出码是用户的训练作业代

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查询处理任务列表 - AI开发平台ModelArts

=X6c3N3eztX7cr3Arvqu&version_id=XwTuRqI9En7xuZskW70%2CJ4Eh2FDEWH1qnDlD3hQ&task_type=sys_data_analyse&return_result=true&query_current=true 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务部署的IP。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
使用kv-cache-int8量化 - 推理模型量化 - AI开发平台ModelArts

ype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8_pertensor #只支持int8，表示kvint8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
Chunked Prefill - AI开发平台ModelArts

甚至更大。执行推理参考 Ascend vllm使用Chunked Prefill特性需参考表1，其它参数请参考启动推理服务。启动推理服务请参考启动推理服务。父主题：推理关键特性使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

算节点。推理部署故障恢复用户部署的在线推理服务运行过程中，如发生硬件故障导致推理实例故障，ModelArts会自动检测到并迁移受影响实例到其它可用节点，实例启动后恢复推理请求处理能力。故障的硬件节点会自动隔离不再调度和运行推理服务实例。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
订阅免费算法 - AI开发平台ModelArts

制台使用，如创建训练作业等。方式一：从算法详情页进入管理控制台在算法详情页单击“前往控制台”。在弹出的“选择云服务区域”页面选择ModelArts所在的云服务区域，单击“确定”跳转至ModelArts控制台的“算法管理 > 我的订阅”页面。方式二：从“我的Gallery”进入管理控制台

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
kv-cache-int8量化 - AI开发平台ModelArts

使用该场景量化方法，无需提前生成量化权重。推理前向会自动计算kv-cache量化系数，并进行kv的量化。在启动推理服务时添加如下参数，启动kv-cache-int8-per-token量化服务。 --kv-cache-dtype int8_pertoken #只支持int8，表示kvint8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化

总条数： 1964

上一页
1
...
73
74
75
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消