搜索_华为云

管理在线服务生命周期 - AI开发平台ModelArts

菜单栏中选择“模型部署>在线服务”，进入在线服务管理页面。单击在线服务列表“操作”列的“更多>删除”删除服务。勾选在线服务列表中的服务，然后单击列表左上角“删除”按钮，批量删除服务。单击目标服务名称，进入服务详情页面，单击右上角“删除”删除服务。删除操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

服务详情”），可以在弹窗中查看推理服务的“服务信息”、“服务日志”和“指标效果”。停止推理服务当“运行中”的推理服务使用完成后，在在线推理服务列表页面，单击操作列的“更多 > 停止服务”即可停止推理服务，节约资源成本。查看推理效果当推理服务处于“运行中”时，在服务列表单击操作列的“更多

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用CTS审计ModelArts Standard服务 - AI开发平台ModelArts

使用CTS审计ModelArts Standard服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明昇腾云服务6.3.904版本发布支持的软件包和能力说明如下，软件包获取路径：Support-E网站。发布包软件包特性说明配套说明备注昇腾云模型代码三方大模型，包名：AscendCloud-3rdLLM PyTorch框架下支持如下模型训练：

帮助中心 > AI开发平台ModelArts > 服务公告 > 版本发布说明
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
Standard推理部署 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案端到端运维ModelArts Standard推理服务方案使用自定义引擎在ModelArts Standard创建模型使用大模型在ModelArts Standard创建模型部署在线服务第三方推理框架迁移到ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
精度调试：TensorBoard可视化 - AI开发平台ModelArts

精度调试：TensorBoard可视化 TensorBoard是TensorFlow的可视化工具包，提供机器学习实验所需的可视化功能和工具。TensorBoard能够有效地展示训练过程中的计算图、各种指标随时间的变化趋势以及训练中使用到的数据信息，帮助用户快速识别训练精度问题。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 迁移调优工具链
精度比对 - AI开发平台ModelArts
精度比对 - AI开发平台ModelArts

精度比对精度比对功能主要针对两类场景的问题：同一模型，从CPU或GPU移植到NPU中存在精度下降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 迁移调优工具链 > 精度调试: msprobe
ModelArts Studio（MaaS）使用场景和使用流程 - AI开发平台ModelArts

Studio大模型即服务平台开通预置服务的商用服务、领取预置服务的免费服务额度或者在我的服务完成模型部署后，可以在其他业务环境中调用该模型服务进行预测。调用ModelArts Studio（MaaS）部署的模型服务免费体验预置服务 ModelArts Studio大模型即服务平台给新用

 帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南
服务状态一直处于“部署中” - AI开发平台ModelArts

服务状态一直处于“部署中” 问题现象服务状态一直处于“部署中”，查看模型日志未发现服务有明显错误。原因分析一般情况都是模型的端口配置有问题。建议您首先检查创建模型的端口是否正确。处理方法模型的端口没有配置，如您在自定义镜像配置文件中修改了端口号，需要在部署模型时，配置对应的端口号，使新的模型重新部署服务。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
部署物体检测服务 - AI开发平台ModelArts

完成资源配置后，单击“继续运行”，服务部署节点将继续运行，直至状态变为“运行成功”，至此，已将模型部署为在线服务。服务测试服务部署节点运行成功后，单击“实例详情”可跳转至对应的在线服务详情页面。单击“预测”页签，进行服务测试。图1 服务测试下面的测试，是您在自动学习物体

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
部署文本分类服务 - AI开发平台ModelArts

完成资源配置后，单击“继续运行”，在弹框中确认继续运行后，服务部署节点将继续运行，直至状态变为“运行成功”，至此，已将模型部署为在线服务。服务测试服务部署节点运行成功后，单击“实例详情”可跳转至对应的在线服务详情页面。单击“预测”页签，进行服务测试。图1 服务测试下面的测试，是您在自动学习文本

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
部署声音分类服务 - AI开发平台ModelArts

完成资源配置后，单击“继续运行”，在弹框中确认继续运行后，服务部署节点将继续运行，直至状态变为“运行成功”，至此，已将模型部署为在线服务。服务测试服务部署节点运行成功后，单击“实例详情”可跳转至对应的在线服务详情页面。单击“预测”页签，进行服务测试。图1 服务测试下面的测试，是您在自动学习声音

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
创建诊断任务 - AI开发平台ModelArts

放到Failed字段上，将弹出具体的失败原因。诊断报告详细介绍请查看查看诊断报告。图9 查看性能诊断报告 OBS路径仅支持OBS并行文件系统。 Report页面将每隔5s自动刷新一次。父主题：性能调优: MA-Advisor性能诊断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 迁移调优工具链 > 性能调优: MA-Advisor性能诊断
Cluster部署推理服务 - AI开发平台ModelArts

Cluster部署推理服务部署准备基于K8s Deployment单机部署推理服务基于KubeInfer多机部署推理服务父主题：主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905）
Server部署推理服务 - AI开发平台ModelArts

Server部署推理服务部署准备基于Docker单机、多机部署父主题：主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905）
管理ModelArts服务的委托授权 - AI开发平台ModelArts

管理ModelArts服务的委托授权本节通过调用一系列API，以管理ModelArts服务的委托授权为例介绍ModelArts API的使用流程。概述管理ModelArts服务的委托授权流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
使用ModelArts Studio（MaaS）部署模型服务 - AI开发平台ModelArts

Studio控制台，在顶部导航栏选择目标区域。在左侧导航栏，选择“在线推理”进入服务列表，单击“我的服务”页签。单击服务名称，进入部署模型服务详情页面，可以查看服务信息。 “详情”：可以查看服务的基本信息，包括服务、模型、资源等设置信息。 “资源监控”：可以查看服务资源监控指标相关信息。表3 资源监控参数说明

 帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1972

上一页
1
...
8
9
10
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消