搜索_华为云

MTP融合权重 - AI开发平台ModelArts

json两个字段。 "architectures": [ "DeepseekV3Fusion" # DeepseekV3ForCausalLM修改为DeepseekV3Fusion ], ...... "num_hidden_layers": 62, # 61修改为62

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 权重量化补充说明
存储配置 - AI开发平台ModelArts
存储配置 - AI开发平台ModelArts

存储配置创建并挂载SFS Turbo 基于tmpfs配置内存缓存（可选）父主题：准备Cluster资源环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Cluster适配NPU的混部推理解决方案 > 准备Cluster资源环境
Lite Server节点故障诊断 - AI开发平台ModelArts

Lite Server节点故障诊断场景描述 Lite Server任务中心提供一键式故障诊断能力，包括参数面网络诊断和昇腾软件诊断。用户无需深入了解具体诊断操作命令，即可自助快捷地在Lite Server产品页面上完成网络和昇腾软件诊断的诉求。参数面网络诊断支持查询卡的网络状态

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server插件管理
调用API - AI开发平台ModelArts
调用API - AI开发平台ModelArts

application/json' -d '{"messages":[{"role":"user","content":"请讲一个笑话"}],"model":"deepseek","temperature":0.6,"max_tokens":1024}' -X POST http://$

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案 > 接入层部署（可选）
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 Lite Server提供多种镜像，您可在创建Lite Server资源前了解当前支持的镜像及对应详情。 NPU Snt9b23超节点服务器支持的镜像详情镜像名称：HCE2.0-Arm-64bit-for-Snt9b23-with-24

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server使用前必读
首次加载权重较慢 - AI开发平台ModelArts

process to init, # it's lazy_init will fail after we load a big model,so we need to init it here torch_npu.npu.init() # 此处增加对set_ini

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 权重量化补充说明
获取模型推理的Profiling数据 - AI开发平台ModelArts

--profiler-level：日志记录层次。字符串类型，三个有效值 "level0"、"level1"、"level2"，默认为level1。 "level0: Collects upper-layer application data, lower-layer NPU data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 推理服务性能评测
单机部署推理服务 - AI开发平台ModelArts

apply -f infer_vllm_kubeinfer.yaml 执行下述命令查看部署状态，当全部Pod的“READ“字段结果都为”1/1”时表示部署成功。 kubectl get po | grep infer 执行下述命令获取 Service 的 ”CLUSETER-IP”。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Cluster适配NPU的混部推理解决方案 > 基于KubeInfer的推理部署
Lite Server使用流程 - AI开发平台ModelArts

本文旨在帮助您了解Lite Server的基本使用流程，帮助您快速上手，使用流程包含以下步骤。图1 使用流程资源开通 Server资源需要先购买才能使用。首先请联系客户经理确认Server资源方案，部分规格为受限规格，因此需要申请开通您所需的资源规格。 Server所需资源可能会超出云

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server使用前必读
停止DevServer实例 - AI开发平台ModelArts

image ServerImageResponse object 参数解释：服务器镜像信息。 category String 参数解释：服务器归属类型。取值范围： HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
删除DevServer实例 - AI开发平台ModelArts

image ServerImageResponse object 参数解释：服务器镜像信息。 category String 参数解释：服务器归属类型。取值范围： HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
DevServer权限 - AI开发平台ModelArts

查询DevServer实例列表 GET /v1/{project_id}/dev-servers modelarts:devserver:listByUser - √ × 查询租户所有DevServer实例列表 GET /v1/{project_id}/dev-servers/all

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
重启DevServer实例 - AI开发平台ModelArts

image ServerImageResponse object 参数解释：服务器镜像信息。 category String 参数解释：服务器归属类型。取值范围： HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
启动DevServer实例 - AI开发平台ModelArts

image ServerImageResponse object 参数解释：服务器镜像信息。 category String 参数解释：服务器归属类型。取值范围： HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
Lite Server节点一键式压测 - AI开发平台ModelArts

Lite Server节点一键式压测场景描述 Lite Server任务中心提供一键式的压测能力，用户无需深入理解AICore，HBM等软件栈，即可自助快捷地在Lite Server产品页面上完成业务压测诉求。支持对昇腾服务器的带宽测试、算力测试、功耗测试、诊断压测等，为AI训

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server插件管理
授权修复Lite Server节点 - AI开发平台ModelArts

作授权按钮为置灰状态。授权“超节点重部署”事件前，您需要先在“轻量算力节点 (Lite Server)页面”停止Server实例，否则会授权失败。事件执行完成后，再重新启动Server实例。授权节点将影响相关业务的运行，请谨慎操作。当事件类型为超节点重部署，且节点处于关机状态时，才可执行授权操作。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源管理
Lite Server超节点扩容和缩容 - AI开发平台ModelArts

扩容节点配置说明参数名称说明系统盘选择“系统盘类型”，并设置“大小”。创建Lite Server时自带系统盘，建议系统盘大小取值至少100GB。增加数据盘单击“增加数据盘”，可以在Lite Server上挂载数据盘。也可以在Lite Server资源创建完成后在云服务器侧实

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server超节点管理
Lite Server资源开通（新版页面） - AI开发平台ModelArts

储配置*购买的节点数量。节点系统盘类型系统盘和规格有关，选择支持挂载的实例规格才会显示此参数。节点系统盘用于存储服务器的操作系统，创建Lite Server时自带系统盘，且系统盘自动初始化。此处支持选择“节点系统盘类型”，并设置“大小”。系统盘大小取值范围在100GiB和1024GiB之间。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

华为EulerOS系统下配置yum源 #在/etc/yum.repos.d/目录下，创建文件EulerOS.repo， cd /etc/yum.repos.d/ mv EulerOS.repo EulerOS.repo.bak vim EulerOS.repo #根据EulerOS版本及系统架构选择配置EulerOS

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源配置 > 配置Lite Server软件环境
发布本地AI应用到AI Gallery - AI开发平台ModelArts

指定时长：设置作业运行几小时后停止，当AI Gallery工具链服务运行时长达到指定时长时，系统将会暂停作业。时长设置不能超过计算资源的剩余额度。说明：如果选择付费资源，则请确认账号未欠费，且余额高于所选计算规格的收费标准，否则可能会导致AI Gallery工具链服务异常中断。AI Gallery的计算规格的计费说明请参见计算规格说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用

总条数： 400

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消