搜索_华为云

更新服务配置 - AI开发平台ModelArts

更新服务配置更新当前服务对象配置。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数；其它平台的Session鉴权请参考Session鉴权。方式1：根据部署在线服务生成的服务对象进行更新服务配置 1 2 3 4 5 6 7

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
模型训练存储加速 - AI开发平台ModelArts

存和加载带来的I/O挑战，华为云提供了基于对象存储服务OBS+高性能弹性文件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo HPC型文件系统来加速对OBS对象存储中的数据访问，并将生成的结果

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型
服务启动失败 - AI开发平台ModelArts

e.py编写有误，可以通过查看服务运行日志，定位具体原因进行修复。拉取镜像失败服务启动失败，提示拉取镜像失败，请参考服务部署、启动、升级和修改时，拉取镜像失败如何处理？资源不足，服务调度失败服务启动失败，提示资源不足，服务调度失败，请参考服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
部署在线服务 - AI开发平台ModelArts

部署在线服务部署在线服务包括：已部署为在线服务的初始化。部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询服务详情 - AI开发平台ModelArts

service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String 服务归属用户。 publish_at

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在ModelArts Standard上运行单机多卡训练作业 - AI开发平台ModelArts

{image_version} 上传镜像完成后，返回容器镜像服务控制台，在“我的镜像”页面，执行刷新操作后可查看到对应的镜像信息。上传数据和算法至SFS ECS服务器已挂载SFS，请参考在ECS服务器挂载SFS Turbo存储。已经在ECS中设置权限，请参考在ECS中设置ModelArts用户可读权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行训练作业
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限场景描述本文介绍如何配置文件夹级的SFS Turbo访问权限，实现在ModelArts中访问挂载的SFS Turbo时，只允许子账号访问特定的SFS Turbo文件夹内容。给子账号配置文件夹级的SFS Turbo访问权限为白名单功能，如果有试用需求，请提工单申请权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

根据提示完成身份验证，下载密钥，并妥善保管。获取在线服务信息在调用接口时，需获取在线服务的调用地址，以及在线服务的输入参数信息。步骤如下：登录ModelArts管理控制台，在左侧导航栏中选择“模型部署 > 在线服务”，默认进入“在线服务”列表。单击目标服务名称，进入服务详情页面。在“在线服务”的详情页面，可以获取该服务的调用地址和输入参数信息。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明本文档主要介绍昇腾云服务6.3.908版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像镜像地址获取方式镜像软件说明配套关系西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明本文档主要介绍昇腾云服务6.3.907版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像镜像地址获取方式镜像软件说明配套关系西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
在推理生产环境中部署推理服务 - 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
基于KubeInfer多机部署推理服务 - AI开发平台ModelArts

状态。下面是一个livenessProbe的配置样例，通过health.sh脚本来探测服务状态，容器启动后2400秒进行第一次探测，每10秒探测一次，单次探测超时时间10秒，连续失败6次认为服务异常。 kind: KubeInfer apiVersion: infer.modelarts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > Cluster部署推理服务
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调试，当前仅支持在开发环境Notebook中调试。本地安装ModelArts SDK步骤在本地安装ModelArts SDK，具体的配置步骤如下：

帮助中心 > AI开发平台ModelArts > SDK参考
昇腾云服务6.5.902版本说明 - AI开发平台ModelArts

昇腾云服务6.5.902版本说明本文档主要介绍昇腾云服务6.5.902版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明 Snt9B PyTorch2.1.0： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
查询服务事件日志 - AI开发平台ModelArts

查询服务事件日志功能介绍查询服务事件日志，包含服务的操作记录及部署过程中的关键动作、部署失败原因。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
advisor调优总体步骤 - AI开发平台ModelArts

存储profiling数据。多机场景如果没有挂载共享存储如SFS Turbo，需要将多机上的profiling复制至同一个目录下才能进行性能分析，这个操作相对较为繁琐且耗时。使用ModelArts时推荐挂载共享网盘如sfs turbo，既能加快训练数据的读取速度又能用于存放性能profi

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 迁移调优工具链 > 性能调优: MA-Advisor性能诊断
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明本文档主要介绍昇腾云服务6.3.909版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明配套关系 Snt9B 西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 昇腾云版本发布说明
标注任务管理 - AI开发平台ModelArts

标注任务管理创建标注任务查询数据集的标注任务列表查询标注任务详情父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理

总条数： 2099

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消