检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤一:开启对分布式云支持 在创建CCE Turbo集群时,您可以在高级配置中开启对分布式云(cloudpond)功能。开启此功能后,系统将创建Turbo分布式集群,该集群能够无缝整合并使用CloudPond边缘计算服务资源,实现中心云与边缘云资源的统一管理和调度。 开启对分布式支持功能
以删除任意一个Pod。 但是在某些场景下,这并不满足需求,比如有些分布式的场景,要求每个Pod都有自己单独的状态时,比如分布式数据库,每个Pod要求有单独的存储,这时Deployment无法满足业务需求。 分布式有状态应用的特点主要是应用中每个部分的角色不同(即分工不同),比如数
个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 Token可通过调用获取用户Token接
擎,不同的集群类型、集群版本、操作系统可能导致支持的容器引擎类型不同,请根据控制台呈现进行选择。具体场景请参见节点操作系统与容器引擎对应关系。 操作系统 选择操作系统类型,不同类型节点支持的操作系统有所不同。 公共镜像:请选择节点对应的操作系统。 私有镜像:支持使用私有镜像,私有
多GPU的分布式计算架构,通过Tensor Parallelism跨GPU切分模型参数,结合Pipeline Parallelism跨节点分配计算阶段,实现多设备协同推理。传统的Kubernetes的Deployment和StatefulSet可以用于部署LLM分布式推理,但存在一些局限性:
况。 快速恢复数据 更换操作系统、应用软件升级或业务数据迁移等重大操作前,您可以创建一份或多份快照,一旦升级或迁移过程中出现问题,可以通过快照及时将业务恢复到快照创建点的数据状态。 例如,当由于云服务器 A的系统盘 A发生故障而无法正常开机时,由于系统盘 A已经故障,因此也无法将
图2 装箱调度对比 前提条件 已创建v1.23及以上版本的CCE Standard/Turbo集群,具体步骤请参见购买Standard/Turbo集群。 集群中已有超节点。CCE Standard/Turbo集群暂不支持购买超节点,您可以在ModelArts中提前购买超节点(Asce
%的流量走灰度版本。 基于请求内容:根据请求内容配置规则,只有请求内容中满足特定条件的流量会切分到灰度版本上。例如只有在Windows操作系统上的用户可以访问灰度版本。 以“基于流量比例”为例,且v3版本流量配比为20%。更多策略内容请参见为服务添加灰度版本。 图7 灰度策略 单击“策略下发”。
Kuberay是一个Kubernetes原生插件,用于在Kubernetes集群(包括CCE Standard/Turbo集群)上管理和运行Ray分布式计算框架。Ray是一个高性能的分布式计算库,常用于机器学习、强化学习和数据处理等场景。Kuberay的目标是将Ray与Kubernetes
间的整数值。 节点端口:指容器映射到节点上的端口。配置完成后,系统会在用户所在项目的所有节点上打开一个真实的端口号。访问工作负载时可以通过“节点IP:节点端口”来访问工作负载。 如无特殊需求,选择“自动生成”即可,系统会自动分配访问端口号。若选择“指定端口”,请填写30000-3
购买集群 集群类型对比 购买Standard/Turbo集群 在CCE Turbo分布式集群中使用边缘云资源 使用KMS进行Secret落盘加密 iptables与IPVS如何选择 父主题: 集群
过载控制。 √ 开启对分布式云支持(homezone/cloudpond) (CCE Turbo集群) 用于统一管理数据中心和边缘的计算资源,用户可以根据业务诉求将容器部署到合适的区域。 该功能需要提前注册智能边缘小站,详情请参见在CCE Turbo分布式集群中使用边缘云资源。 ×
数据集抽象:通过Kubernetes原生API,将底层异构存储(如 HDFS、对象存储、分布式文件系统)封装为统一的逻辑数据集(Dataset),屏蔽存储差异,提供透明访问能力。数据集抽象类似一个数据万能适配器,让应用程序能够以统一的API接口访问异构存储系统,无需关注底层存储位置、数据传输路径或加速机制。 数据
通过StorageClass动态创建SFS Turbo子目录 背景信息 SFS Turbo容量最小500G,且不是按使用量计费。SFS Turbo挂载时默认将根目录挂载到容器,而通常情况下负载不需要这么大容量,造成浪费。 everest插件支持一种在SFS Turbo下动态创建子目录的方法,能够在SFS Turbo下
连接集群概述 连接集群是指与集群进行通信并执行集群管理任务的过程。CCE集群是由多个节点组成的分布式系统,集群内部资源(如Pods、Services、Deployments 等)通常需要通过一些工具和方法进行集中管理和操作。连接集群的过程就是通过kubectl命令行工具、Clou
absolute-path # 表示使用SFS Turbo子目录 everest.io/sfsturbo-share-id: <sfsturbo_id> # SFS Turbo的ID everest.io/path: /a
示例:某部门权限设计及配置 概述 随着容器技术的快速发展,原有的分布式任务调度模式正在被基于Kubernetes的技术架构所取代。云容器引擎(Cloud Container Engine,简称CCE)是高度可扩展的、高性能的企业级Kubernetes集群,支持社区原生应用和工具。
Flink是一个用于大规模数据处理的分布式流处理框架和计算引擎,可以处理有界(批处理)和无界(流处理)数据,提供低延迟、高吞吐量的实时数据处理能力,同时支持复杂事件处理和数据分析。在CCE集群中部署Flink,可以帮助您构建高效、可靠且灵活的数据处理系统,支持多样化的业务应用,并充分利
主要应用于AI、大数据等多任务协作场景。启用该能力后,可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题,大幅度提升整体训练性能。 前提条件 已创建v1.19及以上版本的集群,详情请参见购买Standard/Turbo集群。 已安装Volcano插件,详情请参见Volcano调度器。
修改CCE集群配置 集群配置参数是分布式系统中用于定义节点行为、资源分配、通信规则、扩展策略等的底层规则集,会影响集群的性能、稳定性、扩展性和容错能力。通过调整CCE集群的配置参数,您可以对核心组件进行深度配置。集群配置参数主要分为以下几类,您可以根据需求进行调整。 表1 集群配置参数分类