搜索_华为云

训练服务配置说明 - 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.902） - AI开发平台ModelArts

训练服务配置说明参数配置说明 tokenizer文件修改断点续训和故障快恢说明数据说明模型最小卡数配置父主题：主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.902）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.902）
推理服务性能评测 - 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

推理服务性能评测语言模型推理性能测试多模态模型推理性能测试父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

AppKey和AppSecret不匹配当服务预测使用的AppKey和AppSecret不匹配时，报错“APIG.1009”：“AppKey or AppSecret is invalid”。查询AppKey和AppSecret，使用APP认证访问在线服务，请参考访问在线服务（APP认证）。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4503。原因分析及处理方法服务预测报错ModelArts.4503有多种场景，常见场景如下：通信出错请求报错：{"

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
查看批量服务详情 - AI开发平台ModelArts

表1 批量服务参数参数说明名称批量服务名称。服务ID 批量服务的ID。状态批量服务当前状态。任务ID 批量服务的任务ID。实例规格批量服务的节点规格。实例数批量服务的节点个数。任务开始时间本次批量服务的任务开始时间。环境变量批量服务创建时填写的环境变量。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
修改批量服务配置 - AI开发平台ModelArts

修改批量服务配置对于已部署的服务，您可以修改服务的基本信息以匹配业务变化，更换模型的版本号，实现服务升级。您可以通过如下两种方式修改服务的基本信息：方式一：通过服务管理页面修改服务信息方式二：通过服务详情页面修改服务信息前提条件服务已部署成功，“部署中”的服务不支持修改服务信息进行升级。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
训练服务配置说明 - 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905） - AI开发平台ModelArts

训练服务配置说明参数配置说明 tokenizer文件修改数据说明模型最小卡数配置 VeRL数据处理样例脚本父主题：主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905）
推理服务性能评测 - 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） - AI开发平台ModelArts

推理服务性能评测语言模型推理性能测试多模态模型推理性能测试获取模型推理的Profiling数据父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
切换或重置Lite Server服务器操作系统 - AI开发平台ModelArts

Server列表中，单击右侧下的““切换操作系统””或“重置操作系统”，在弹出的确认对话框中，确认信息无误，然后单击“确定”，完成操作。此时Lite Server节点或超节点的状态显示“切换操作系统中”或“重置操作系统中”。在BMS控制台切换操作系统获取操作系统镜像。由云服务官方提供给客户操作系统镜像，在I

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源管理
在ModelArts Studio（MaaS）升级模型服务 - AI开发平台ModelArts

仅当模型服务处于这几个状态下才能进行服务升级：运行中、告警。服务升级服务升级不可逆。服务升级过程中，原部署服务将正常运行。升级期间、升级完成后，仍然会按照该服务原计费方式产生费用。登录ModelArts Studio控制台，在顶部导航栏选择目标区域。在左侧导航栏，选择“在线推理”。在“在线推理”

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > 在ModelArts Studio（MaaS）管理我的服务
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

在部署为在线服务时，您可以开启支持APP认证功能。或者针对已部署完成的在线服务，您可以修改服务，开启支持APP认证功能。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署 > 在线服务”，进入在线服务管理页面。开启支持APP认证功能。在部署为在线服务时，即“部署

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，报错“ModelArts.4206”。原因分析 ModelArts.4206表示该API的请求流量超过了设定值。为了保证服务的平稳运行，ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错DL.0105 - AI开发平台ModelArts

在线服务预测报错DL.0105 问题现象在线服务预测报错DL.0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error 问题现象在Vnt1 GPU裸金属服务器（Ubuntu18.04系统），安装NVIDIA 470+CUDA 11.4后使用“nvidia-smi”和“nvcc

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
与其他云服务的关系 - AI开发平台ModelArts

与其他云服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
在推理生产环境中部署推理服务 - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4302。原因分析及处理方法服务预测报错ModelArts.4302有多种场景，以下主要介绍两种场景： "error_msg":

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
管理在线服务生命周期 - AI开发平台ModelArts

菜单栏中选择“模型部署>在线服务”，进入在线服务管理页面。单击在线服务列表“操作”列的“更多>删除”删除服务。勾选在线服务列表中的服务，然后单击列表左上角“删除”按钮，批量删除服务。单击目标服务名称，进入服务详情页面，单击右上角“删除”删除服务。删除操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍对于普通企业来说，大模型开发不仅需要强大的算力，还需要学习训练、部署的相关参数配置和规格选择等专业知识。ModelArts Studio大模型即服务平台（后续简称为MaaS服务）作为一个面向客户的大模型服务化平台，提供简单易用的模型开发工具链，支

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
部署的在线服务状态为告警 - AI开发平台ModelArts

部署的在线服务状态为告警问题现象在部署在线服务时，状态显示为“告警”。解决方法使用状态为告警的服务进行预测，可能存在预测失败的风险，请从以下4个角度进行排查，并重新部署。后台预测请求过多。如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 1972

上一页
1
...
7
8
9
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消