检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与其他服务的关系 图1 EMS与其他服务的关系 表1 EMS与其他服务的关系 服务名称 EMS服务与其他服务的关系 主要交互功能 云容器引擎 (Cloud Container Engine,CCE) EMS数据面镜像基于CCE云容器引擎服务进行安装部署。 部署EMS数据集群 云硬盘(Elastic
身份认证与访问控制 IAM身份认证 用户访问EMS服务控制台时,其本质是通过EMS服务管理面提供的REST风格的API接口进行请求。 EMS服务管理面的接口支持认证请求,需要用户从华为云统一身份认证服务 IAM获取正确的鉴权信息才能访问成功。关于IAM鉴权信息的详细介绍及获取方式,请参见认证鉴权。
约束限制: 无 取值范围: 大于0。 默认取值: 无 返回结果 表4 返回结果 类型 说明 CcFuture 参数解释: 返回异步执行Future句柄。 取值范围: 无 表5 CcFuture 方法名称 参数 返回结果 描述 result 无 CcResult 参数解释: 获取异步执行的结果。
约束限制: 无 取值范围: 大于0。 默认取值: 无 返回结果说明 表4 返回结果 类型 说明 CcFuture 参数解释: 返回异步执行Future句柄。 取值范围: 无 表5 CcFuture 方法名称 参数 返回结果 描述 result 无 CcResult 参数解释: 获取异步执行的结果。
为保证数据传输的安全性,访问EMS服务控制台时支持HTTPS协议。 操作认证 所有EMS服务管理面的API都会进行IAM身份认证。 审计与安全 出于分析或审计等目的,用户可以开启日志记录功能。通过将EMS日志规则配置到云日志服务 LTS,您可以获取EMS数据面的相关运行日志,从而帮助您定位问题。 服务韧性
Ems存储相关接口 获取Context Caching对象 健康检查
产品架构 EMS产品架构主要由三部分组成:领域专用服务SDK、分布式内存池和管理面。请参考图1 EMS产品架构。 图1 EMS产品架构 领域专用服务SDK包含一系列面向不同AI应用场景的插件和接口服务SDK,提供业务系统接入、业务数据布局和近数据处理等功能,实现业务请求的内存
产品优势 EMS内存存储具有以下优势: 半托管融合部署,降低成本 EMS数据面部署在AI服务器上,采用融合部署,统一纳管AI服务器上空闲的DRAM内存资源,复用DRAM内存资源,提供推理加速服务,降低推理KVCache存储成本。 分级缓存,提升推理吞吐,优化推理时延 EMS通过构建
Token,TTFT),同时也节省了推理算力,提高推理吞吐,加速了大模型推理服务的效率。 建议搭配服务 AI开发平台 ModelArts、云容器引擎 CCE、高性能弹性文件服务 SFS Turbo、对象存储服务 OBS。 图1 LLM大语言模型推理
/var/log/dfv/infrastructure/zookeeper4sl/*.log dmk_zk-zk_log_0-{cluster_id} 容器内挂载 /var/log/dfv/infrastructure/zookeeper4sl/*.log.0 EMS根据微服务创建日志组,日志组的名称
加速卡计算产生的KVCache连续显存长度。 约束限制: 无 取值范围: 大于0。 默认取值: 无 返回结果说明 表4 返回结果 类型 说明 CcFuture 参数解释: 返回异步执行Future句柄。 取值范围: 无 表5 CcResult 参数名称 参数类型 描述 success int 参数解释: 请求的批量key读写连续成功的个数。
产品功能 表1列出了弹性内存存储服务EMS提供的常用功能特性。 表1 EMS功能概览 功能名称 功能描述 创建凭证 使用EMS前,需要先创建凭证,用于激活EMS。 部署EMS 在已创建的CCE集群的节点上部署EMS,以提供内存服务。 激活EMS 使用已创建的凭证激活EMS后,才能正常使用EMS。
储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 可用区(AZ,Availability
EMS存储初始化 功能说明 Ems是访问EMS服务的Python客户端,它为调用者提供一系列与EMS服务进行交互的接口,提供EMS内存池健康检查等能力,以及ContextCaching等存储功能。 方法定义 init(config) 构造函数参数描述 参数名称 参数类型 是否必选
异常处理 获取错误码 获取详细信息
在“终端节点”页面,单击“购买终端节点”。进入“购买终端节点”页面。 “服务类别”:“按名称查找”。 “服务名称”填写表1并单击“验证”。 若显示“已找到服务”,继续后续操作。 若显示“未找到服务”,请检查“区域”是否和终端节点服务所在区域一致或输入的“服务名称”是否正确。 “虚拟私有云”和“子网”选择租
健康检查接口主要用于探测EMS存储服务状态是否工作正常,可以用于服务熔断后恢复场景。 方法定义 Ems.check_health() 请求参数说明 无 返回结果说明 表1 返回结果 类型 说明 bool 参数解释: EMS存储服务是否正常。 取值范围: False:表示EMS服务异常。 True:表示EMS服务正常。
收集日志 日志接入 日志授权
常见问题 EMS初始化失败如何定位? ContextCaching接口超时时间如何设置?
初始化 EMS存储初始化 环境变量