搜索_华为云

创建在线服务包 - AI开发平台ModelArts

表2 请求Body参数参数是否必选参数类型描述 status 否 String 服务包状态。 pool_id 是 String 资源池ID。 service_id 否 String 在线服务ID。 workflow_id 否 String Workflow工作流ID。 order

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
基于KubeInfer多机部署推理服务 - AI开发平台ModelArts

状态。下面是一个livenessProbe的配置样例，通过health.sh脚本来探测服务状态，容器启动后2400秒进行第一次探测，每10秒探测一次，单次探测超时时间10秒，连续失败6次认为服务异常。 kind: KubeInfer apiVersion: infer.modelarts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > Cluster部署推理服务
在推理生产环境中部署推理服务 - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
切换或重置Lite Server服务器操作系统 - AI开发平台ModelArts

Server列表中，单击右侧下的““切换操作系统””或“重置操作系统”，在弹出的确认对话框中，确认信息无误，然后单击“确定”，完成操作。此时Lite Server节点或超节点的状态显示“切换操作系统中”或“重置操作系统中”。在BMS控制台切换操作系统获取操作系统镜像。由云服务官方提供给客户操作系统镜像，在I

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源管理
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明本文档主要介绍昇腾云服务6.3.907版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像镜像地址获取方式镜像软件说明配套关系西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明本文档主要介绍昇腾云服务6.3.908版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像镜像地址获取方式镜像软件说明配套关系西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

根据提示完成身份验证，下载密钥，并妥善保管。获取在线服务信息在调用接口时，需获取在线服务的调用地址，以及在线服务的输入参数信息。步骤如下：登录ModelArts管理控制台，在左侧导航栏中选择“模型部署 > 在线服务”，默认进入“在线服务”列表。单击目标服务名称，进入服务详情页面。在“在线服务”的详情页面，可以获取该服务的调用地址和输入参数信息。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用CTS审计ModelArts Standard服务 - AI开发平台ModelArts

使用CTS审计ModelArts Standard服务 ModelArts Standard支持云审计的关键操作查看ModelArts Standard相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 Token在计算机系统中代表令牌（临时）的意思。拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。如果在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明本文档主要介绍昇腾云服务6.3.909版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明配套关系 Snt9B 西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
与其他云服务的关系 - AI开发平台ModelArts

与其他云服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
在ModelArts Studio（MaaS）升级模型服务 - AI开发平台ModelArts

在“在线推理”页面，单击“我的服务”页签。在目标模型服务右侧，单击操作列的“更多 > 服务升级”。在“服务升级”对话框，选择需要升级的版本，然后单击“确认”。图1 服务升级后续操作模型体验：模型服务扩缩容后，可以在“模型体验”调用该模型服务进行功能体验。调用模型服务：模型服务扩缩容后，可

 帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）在线推理服务 > 在ModelArts Studio（MaaS）管理我的服务
查询服务对象列表 - AI开发平台ModelArts

service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String 服务归属用户。 publish_at

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
昇腾云服务6.5.902版本说明 - AI开发平台ModelArts

昇腾云服务6.5.902版本说明本文档主要介绍昇腾云服务6.5.902版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明 Snt9B PyTorch2.1.0： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明本文档主要介绍昇腾云服务6.3.912版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明 Snt9B PyTorch2.1.0： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
昇腾云服务6.5.901版本说明 - AI开发平台ModelArts

昇腾云服务6.5.901版本说明本文档主要介绍昇腾云服务6.5.901版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明 Snt9B PyTorch2.1.0： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
昇腾云服务6.5.905版本说明 - AI开发平台ModelArts

昇腾云服务6.5.905版本说明本文档主要介绍昇腾云服务6.5.905版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明 Snt9B swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍对于普通企业来说，大模型开发不仅需要强大的算力，还需要学习训练、部署的相关参数配置和规格选择等专业知识。ModelArts Studio大模型即服务平台（后续简称为MaaS服务）作为一个面向客户的大模型服务化平台，提供简单易用的模型开发工具链，支

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
使用ModelArts Studio（MaaS）部署模型服务 - AI开发平台ModelArts

Studio（MaaS）部署的模型服务。查看部署服务信息登录ModelArts Studio（MaaS）控制台，在顶部导航栏选择目标区域。在左侧导航栏，选择“在线推理”进入服务列表，单击“我的服务”页签。单击服务名称，进入部署模型服务详情页面，可以查看服务信息。 “详情”：可以查看服务的基本信息，包括服务、模型、资源等设置信息。

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）在线推理服务

总条数： 1968

上一页
1
...
5
6
7
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消