搜索_华为云

ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
推理性能测试 - 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

推理性能测试 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
部署在线服务 - AI开发平台ModelArts

部署在线服务部署在线服务包括：已部署为在线服务的初始化。部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
节点本地域名解析加速（NodeLocal DNSCache） - AI开发平台ModelArts

默认开启全部命名空间 DNSConfig 自动注入，即自动添加标签 node-local-dns-injection=enabled （包含存量命名空间，不含系统内置的命名空间）。当Pod中存在DNS配置时，优先使用Pod的DNS配置。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理 > 管理Standard专属资源池插件
Lite Cluster资源配置流程 - AI开发平台ModelArts

Lite Cluster资源配置流程本章节介绍Lite Cluster环境配置详细流程，适用于加速卡环境配置。前提条件已完成集群资源购买和开通，具体请参见Lite Cluster资源开通。集群的配置使用需要用户具备一定的知识背景，包括但不限于Kubernetes基础知识、网络知识

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
更新开发环境实例信息 - AI开发平台ModelArts

如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询服务对象列表 - AI开发平台ModelArts

查询服务对象列表获取当前用户服务对象列表。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景1：查询当前用户所有服务对象 1 2 3 4 5 6 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理性能测试 - 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

推理性能测试本章节介绍如何进行推理性能测试，建议在Notebook的JupyterLab中另起一个Terminal，执行benchmark脚本进行性能测试。若需要在生产环境中进行推理性能测试，请通过调用接口的方式进行测试。 benchmark方法介绍性能benchmark包括两部分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 大模型&AIGC待下线案例 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
Standard专属资源池插件概述 - AI开发平台ModelArts

如遇到插件配置错误或资源不足所有实例均无法调度等情况，系统会在10分钟后将该插件置为“不可用”状态。运行中稳定状态插件正常运行状态，所有插件实例均正常部署，插件可正常使用。升级中中间状态插件正处于更新状态。不可用稳定状态不可用，表示插件状态异常，插件不可使用。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理 > 管理Standard专属资源池插件
附录：训练常见问题 - 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
创建处理任务 - AI开发平台ModelArts

创建处理任务功能介绍创建处理任务，支持创建“特征分析”任务和“数据处理”两大类任务。可通过指定请求体中的复合参数“template”的“id”字段来创建某类任务。 “特征分析”是指基于图片或目标框对图片的各项特征，如模糊度、亮度进行分析，并绘制可视化曲线，帮助处理数据集。 “数据处理

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明昇腾云服务6.3.904版本发布支持的软件包和能力说明如下，软件包获取路径：Support-E网站。发布包软件包特性说明配套说明备注昇腾云模型代码三方大模型，包名：AscendCloud-3rdLLM PyTorch框架下支持如下模型训练

 帮助中心 > AI开发平台ModelArts > 服务公告 > 版本发布说明
附录：训练常见问题 - 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
附录：训练常见问题 - 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
Lite Cluster插件概述 - AI开发平台ModelArts

如遇到插件配置错误或资源不足所有实例均无法调度等情况，系统会在10分钟后将该插件置为“不可用”状态。运行中稳定状态插件正常运行状态，所有插件实例均正常部署，插件可正常使用。升级中中间状态插件正处于更新状态。不可用稳定状态不可用，表示插件状态异常，插件不可使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster插件管理
查询开发环境实例列表 - AI开发平台ModelArts

如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
推理性能测试 - 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

推理性能测试本章节介绍如何进行推理性能测试，建议在Notebook的JupyterLab中另起一个Terminal，执行benchmark脚本进行性能测试。若需要在生产环境中进行推理性能测试，请通过调用接口的方式进行测试。约束限制创建在线服务时，每秒服务流量限制默认为100次

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 大模型&AIGC待下线案例 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查看Standard专属资源池详情 - AI开发平台ModelArts

开启节点绑定后，系统会自动绑定相应数量的专属节点，任务只能在这些绑定的节点上运行，确保资源专有性和稳定性。主要适用于需要高资源保障和稳定性的任务场景。节点绑定作用如下：提高任务稳定性：通过绑定特定节点，任务不会因节点动态分配而中断，确保任务的连续性和稳定性。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理 > 管理Standard专属资源池
审计与日志 - AI开发平台ModelArts

在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。对接云审计服务的配置方法请参见查看审计日志章节。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全

总条数： 1744

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消