搜索_华为云

已找到以下 1912 条记录

AI智能搜索

产品选择

AI开发平台ModelArts

所有产品

弹性云服务器 ECS

Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

云耀云服务器（旧版）

Huawei Cloud EulerOS

云化数据中心 CloudDC

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

高性能弹性文件服务 SFS Turbo

弹性文件服务 SFS

业务恢复服务 BRS

弹性内存存储 EMS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

云原生应用网络 ANC

云解析服务 DNS

云容器引擎 CCE

Autopilot集群

云容器实例 CCI

云容器实例 CCI 1.0

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 TaurusDB

云数据库 TaurusDB标准版

AI开发平台ModelArts

盘古大模型 PanguLargeModels

图引擎服务 GES

AI科学计算服务

自动驾驶云服务 Octopus

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

华为HiLens

MapReduce服务 MRS

MRS on CCE

数据湖探索 DLI

数据仓库服务 DWS

云搜索服务 CSS

企业搜索服务 KooSearch

数据治理中心 DataArts Studio

表格存储服务 CloudTable

可信智能计算服务 TICS

数据接入服务 DIS

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

数智融合计算服务 DataArtsFabric

数据可视化 DLV

设备接入 IoTDA

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

华为云Astro轻应用

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

CodeArts 智能助手

华为云Astro大屏应用

效能洞察 CodeArts Board

域名注册服务 Domains

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

政企自服务管理 ESM

智能体平台 Versatile

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

CloudDevice 服务

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

行业视频管理服务 IVM

数字内容生产线 MetaStudio

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

认证测试中心 CTC

边缘安全 EdgeSec

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

盘古Doer

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MgC

区块链服务 BCS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

解决方案工作台

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

云采用框架

云架构中心

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

工业数据转换引擎云服务

没有找到结果，请重新输入

产品选择

AI开发平台ModelArts

在搜索结果页开启AI智能搜索

开启

产品选择

取消所有产品

弹性云服务器 ECS

Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

云耀云服务器（旧版）

Huawei Cloud EulerOS

云化数据中心 CloudDC

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

高性能弹性文件服务 SFS Turbo

弹性文件服务 SFS

业务恢复服务 BRS

弹性内存存储 EMS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

云原生应用网络 ANC

云解析服务 DNS

云容器引擎 CCE

Autopilot集群

云容器实例 CCI

云容器实例 CCI 1.0

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 TaurusDB

云数据库 TaurusDB标准版

AI开发平台ModelArts

盘古大模型 PanguLargeModels

图引擎服务 GES

AI科学计算服务

自动驾驶云服务 Octopus

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

华为HiLens

MapReduce服务 MRS

MRS on CCE

数据湖探索 DLI

数据仓库服务 DWS

云搜索服务 CSS

企业搜索服务 KooSearch

数据治理中心 DataArts Studio

表格存储服务 CloudTable

可信智能计算服务 TICS

数据接入服务 DIS

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

数智融合计算服务 DataArtsFabric

数据可视化 DLV

设备接入 IoTDA

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

华为云Astro轻应用

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

CodeArts 智能助手

华为云Astro大屏应用

效能洞察 CodeArts Board

域名注册服务 Domains

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

政企自服务管理 ESM

智能体平台 Versatile

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

CloudDevice 服务

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

行业视频管理服务 IVM

数字内容生产线 MetaStudio

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

认证测试中心 CTC

边缘安全 EdgeSec

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

盘古Doer

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MgC

区块链服务 BCS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

解决方案工作台

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

云采用框架

云架构中心

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

工业数据转换引擎云服务

没有找到结果，请重新输入

停止回答

已停止生成

正在生成

申请解除

展开

收起

了解详细信息

内容由AI生成，仅供参考，请遵守《服务声明》

您的反馈将帮助我们优化体验

理解有误

未理解指令

未理解上下文

回答不佳

内容错误

答非所问

回答不完整

逻辑混乱

格式错误

回答速度慢

没有帮助

0/200

确定取消

修改Cluster集群配置 - AI开发平台ModelArts

修改Cluster集群配置等待AI专属集群创建完成后，在配置管理中关闭Dropcache，大模型场景开启dropcache容易导致pagecache失效。更多配置说明参考：https://support.huaweicloud.com/usermanual-cluster-mode

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Cluster适配NPU的混部推理解决方案 > 准备Cluster资源环境 > 购买并开通资源
KubeInfer部署方案介绍 - AI开发平台ModelArts

KubeInfer部署方案介绍图1 XP1D KubeInfer部署方案 KubeInfer是由ModelArts提供的一种K8s的CRD扩展插件，它通过定义instance概念，把合作干一件事的Pod统一在一个instance下，按组实现扩缩容、故障恢复、组内通信等的管理，同

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Cluster适配NPU的混部推理解决方案 > 基于KubeInfer的推理部署 > 部署准备
生成部署定义yaml - AI开发平台ModelArts

[--parameters="xxx"] [--file-name=xx] 针对该实例默认创建NodePort类型的K8s service，对外nodePort默认为30090。如果您要在同一个K8s集群中部署多个kubeinfer实例，注意非单kubeinfer多instance

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案 > 基于KubeInfer的推理部署 > 部署准备
扩缩容推理服务（可选） - AI开发平台ModelArts

kubeinfer kubectl edit kubeinfer ${kubeinfer_name} 或修改yaml配置，然后重新生效： vim infer_vllm_kubeinfer.yaml kubectl apply -f infer_vllm_kubeinfer.yaml

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 基于KubeInfer的推理部署
在Lite Cluster跨区域访问其他服务 - AI开发平台ModelArts

企业在华为云账号A的华北-乌兰察布一创建了Lite Cluster资源池，在西南-贵阳一区域已搭建站点服务或数据，华北-乌兰察布一的Lite Cluster资源池需要访问西南-贵阳一区域的数据或服务。创建一个云连接实例，将VPC接入云连接实例内，云连接实例内的VPC则可以实现网络互通。图1 资源池跨区域访问

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster资源使用
准备Cluster资源环境 - AI开发平台ModelArts

准备Cluster资源环境购买并开通资源配置kubectl访问集群网络存储配置父主题： DeepSeek模型基于ModelArts Lite Cluster适配NPU的PD分离推理解决方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Cluster适配NPU的PD分离推理解决方案
基于KubeInfer的推理部署 - AI开发平台ModelArts

基于KubeInfer的推理部署部署准备 PD分离部署推理服务扩缩容推理服务（可选）升级推理服务（可选）父主题： DeepSeek模型基于ModelArts Lite Cluster适配NPU的PD分离推理解决方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Cluster适配NPU的PD分离推理解决方案
检查环境 - 准备、安装部署依赖 - AI开发平台ModelArts

hdk-npu-driver_版本号_linux-aarch64.run”。 Snt9b资源使用的固件包名称为”Ascend-hdk-910b-npu-firmware_版本号.run”，驱动包名称为”Ascend-hdk-910b-npu-driver_版本号_linux-aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 准备、安装部署依赖
日志采集与转储 - AI开发平台ModelArts

日志采集与转储接入层日志采集与转储（可选）推理层日志管理父主题： Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案
常见运维操作指导 - AI开发平台ModelArts

常见运维操作指导多实例推理服务手动摘流指导多实例推理服务无感升级指导父主题： Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案
FAQ - AI开发平台ModelArts
FAQ - AI开发平台ModelArts

K8s master节点重启问题现象：K8s master节点重启后，POD存在UnexpectedAdmissionError状态，且服务无法正常启动。解决方法：需要在K8s master节点重启恢复后重启Volcano等组件，并重启业务实例。镜像通过docker load到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案
部署准备 - AI开发平台ModelArts
部署准备 - AI开发平台ModelArts

基础容器镜像地址。 docker pull {image_url} 步骤三：上传模型权重文件上传安装依赖软件推理代码AscendCloud-LLM-xxx.zip和算子包AscendCloud-OPP-xxx.zip到主机中，包获取路径请参见表1。将权重文件上传到Server机器中。权重文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > Server部署推理服务
获取权重文件 - AI开发平台ModelArts

获取权重文件准备FP8权重准备W8A8权重父主题：准备、安装部署依赖

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 准备、安装部署依赖
获取推理镜像 - AI开发平台ModelArts

表1 基础镜像资源类型基础镜像地址 Snt9b23 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.2.rc1-py_3.11-hce_2.0.2503-a

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 准备、安装部署依赖
安装Volcano - AI开发平台ModelArts
安装Volcano - AI开发平台ModelArts

req -new -key server.key -out server.pem -subj "/C=CN/ST=ZJ/L=HZ/O=HW/OU=ModelArts/CN=server/" #使用CA证书签发server证书（10年有效期） openssl x509 -req -extfile

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 准备、安装部署依赖
流程与约束 - AI开发平台ModelArts

流程与约束场景描述本文档介绍了在ModelArts的Lite Server上基于Ascend-vllm推理框架部署开源三方大模型的解决方案。推理使用的算力资源是Ascend Snt9b和Snt9b23。使用流程图1 使用流程推荐您根据以下使用流程使用本解决方案部署开源三方大模型：

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案
检查环境 - 准备、安装部署依赖 - AI开发平台ModelArts

hdk-npu-driver_版本号_linux-aarch64.run”。 Snt9b资源使用的固件包名称为”Ascend-hdk-910b-npu-firmware_版本号.run”，驱动包名称为”Ascend-hdk-910b-npu-driver_版本号_linux-aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案 > 准备、安装部署依赖
报错“Failed to install the VS Code Server.”或“tar: Error is not recoverable: exiting now.”如何解决？ - AI开发平台ModelArts

the VS Code Server.”或“tar: Error is not recoverable: exiting now.”如何解决？问题现象或原因分析可能为/home/ma-user/work磁盘空间不足。解决方法删除/home/ma-user/work路径下无用文件。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
配置推理层监控告警 - AI开发平台ModelArts

配置推理层监控告警在CES中查看指标并配置告警在Prometheus查看vLLM业务指标父主题：查看指标、配置告警

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案 > 查看指标、配置告警
配置kubectl访问集群网络 - AI开发平台ModelArts

访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。如果显示如图3的内容，则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容父主题：准备Cluster资源环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek&Qwen3基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Cluster适配NPU的PD分离推理解决方案 > 准备Cluster资源环境

总条数： 1912

上一页
1
...
15
16
17
...
96
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消