检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概念类问题 什么是KVCache
控制台使用类问题 为什么需要激活凭证
初始化 EMS存储初始化 环境变量
print(f"failed to save, {e}.") exit(2) try: for future in future_list: result = future.result() print(f"rsult:{result}") except
部署类问题 EMS内存池需要占用AI节点多少DRAM内存 在执行主机配置脚本的过程中,无返回信息怎么办
Ems存储相关接口 获取Context Caching对象 健康检查
修订记录 发布日期 修订记录 2025-6-30 第一次发布测试版。 2025-8-30 第一次发布V1接口测试版
基本概念 EMS基本概念
安全 责任共担 身份认证与访问控制 数据保护技术 认证证书
凭证管理 创建凭证
集群管理 部署EMS 激活EMS 升级EMS 卸载EMS
检查异步IO状态 ContextCaching.is_ready 检测返回的异步Future对象是否已完成计算。 获取异步IO结果 ContextCaching. get_result 获取返回的异步Future对象的结果。
快速入门 初始化EMS客户端 本示例用于初始化EMS客户端配置并启动EMS服务。 # 引入模块 import os, torch, torch_npu from ems import Ems, EmsConfig, EmsException, CcConfig, CcKvOption
请求并发数、每个请求的键值对数量有关系,当前单个请求超时时间默认5秒,用户可以根据SLO(Service Level Objective,服务级别目标,例如吞吐、首token时延等)、请求batch数和KVCache数据量,合理设置超时时间。例如:长序列场景要求的首token时延是5秒,超时时间建议设置为3秒。
确保将宿主机EMS服务端容器共享的unix domain socket目录"/mnt/paas/kubernetes/kubelet/ems",通过增加负载配置文件hostPath项,将目录映射到推理/训练容器目录:"/dev/shm/ems";同时推理/训练容器内,运行服务的用户能够读写该文件夹及其文件。
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书
EMS数据面镜像部署在用户的CCE容器集群上,EMS镜像的日志、监控、告警需要对接云日志服务 LTS、应用运维管理 AOM等运维监控平台,并需要通过委托授权等方式将EMS镜像日志、监控等数据同步给EMS服务。 EMS功能限制 EMS提供的是内存缓存,不是持久化存储,在EMS镜像重启/升级
减少冗余计算,从而显著提升推理效率。 LLM推理 LLM(Large Language Model)推理服务旨在为大规模语言模型(LLM)的推理任务提供高效、低延迟的在线服务能力。EMS通过KVCache缓存、多级缓存、分布式内存池化以及智能亲和调度等技术,加速推理速度并降低资源消耗。
EMS内存池故障。 SDK到EMS内存池连接断开。 将EMS服务隔离,待健康检查通过后恢复。 EMS_IO_TIMEOUT 请求IO超时 EMS内存池IO压力较大,业务繁忙。 SDK业务压力大,导致IO排队时间久。 增加超时时间后重试,或者将EMS服务隔离,待健康检查通过后恢复。 EMS_INTERNAL_ERROR
卸载EMS EMS使用helm uninstall命令卸载EMS后台系统,同时通过主机配置脚本,还原系统大页配置。 卸载EMS后台系统 返回到CCE控制台,在左侧导航栏中单击“集群管理”。在右侧集群列表中,找到对应集群,在右侧单击“命令行工具”进入命令行。 待命令行工具界面初始化完毕后,在命令行输入helm