计费项 Fabric服务根据RAY、推理业务场景有不同的策略进行计费。详细的计费项及说明请参考表1。每个计费项的详细价格请参考产品价格详情。 表1 计费项信息 计费项 计费说明 RAY资源 此处根据您创建的RAY资源规格和数量按照使用时间进行计费,不同的数据处理单元或AI计算单元
Fabric在同一区域。具体请参见创建OBS桶。 操作步骤 登录Fabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”。 在左侧菜单栏中选择“资源与资产> 模型”,进入“模型”管理页面。 图1 进入模型管理页面 查看当前模型下面的版本列表;您可以使用该版本,即设置为当前版本。
获取端点ID 进入Fabric服务的工作空间管理台,进入您需要操作的工作空间。在“推理端点”或“Ray集群”页签中找到您需要的端点,单击端点进入“端点详情”,即可查看端点ID。 父主题: 附录
方便用户快速了解文本内容。 机器翻译:大语言模型可以处理多种语言之间的翻译任务,实现跨语言交流。 当前Fabric提供以下两种方式进行推理: 用公共推理服务进行推理:Fabric提供基于开源大语言模型(Qwen2、GLM4等)的公共推理服务,用户可以在推理端点查看公共端点,选择自
ray产品规格 类型 规格 算力 DPU fabric.ray.dpu.d1x 提供约4CPU16G内存算力。 fabric.ray.dpu.d2x 提供约8CPU32G内存算力。 fabric.ray.dpu.d4x 提供约16CPU64G内存算力。 fabric.ray.dpu.d8x 提供约32CPU128G内存算力。
查看部署的Service实例详情 功能介绍 查看部署后的Service实例的详情 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET https://localhost
列举已部署的Service实例 功能介绍 列举已部署的Service实例 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET https://localhost.
创建工作空间 工作空间是Fabric的基本单元,后续所有的操作都在工作空间中进行。因此在账号授权配置完成,需要首先创建工作空间。 用户可根据实际需要创建一个或多个工作空间,各个工作空间是单独隔离的。 前提条件 已有可正常使用的华为云账号。 操作步骤 登录华为云控制台后,在页面左上
按需 后付费 按照云服务器实际使用时长计费。 按照资源实际使用量,每小时出话单扣费。 RAY资源、MU时。 Fabric服务不同业务场景的计费模式如图1所示。 图1 Fabric计费模式 父主题: 计费说明
网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号
准备工作 创建IAM用户并授权使用Fabric 配置Fabric服务委托权限 创建工作空间
如果账号欠费,会根据“客户等级”定义不同的保留期时长。进入保留期后您在Fabric服务中创建的Ray资源及模型实例会予以保留,账号会处于受限状态。在受限状态下,您无法通过控制台创建端点和使用端点,但仍然可以执行其他操作。保留期满仍未缴清欠款,存储在Fabric中的数据将被删除且无法恢复。 关于保留期时长等更多详细介绍,详见保留期。
查询系统协议 功能介绍 查询系统协议。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET https://localhost.com/v1/agreement-rule
获取企业项目ID 登录Fabric控制台。 选择“企业 > 项目管理”,进入企业项目列表。 在“企业项目管理”页面的“名称/ID”列,单击复制按钮,即可复制企业项目ID。 父主题: 附录
产品优势 Fabric服务具有以下优势: 数智一站式开发,提供统一的开发体验 一个工作空间,提供多种工作负载,包含SQL、基于Ray的数据工程、模型推理。 基于LakeFormation统一管理结构化、半结构化、非结构化数据,数智开发全流程,一份元数据和一份权限控制。 数据+AI共享一份数据,客户无需进行数据复制。
变更配置 当前Fabric服务计费项仅支持修改RAY资源,其他业务场景都是按使用量按需计费,不涉及订单变更流程,且暂时不支持计费方式变更,因此变更配置只涉及Ray资源大小变更场景。 修改Ray资源大小对费用影响如表1所示: 表1 费用影响 当前计费模式 变更场景 对费用的影响 按需
应用场景 本节介绍Fabric服务的主要应用场景。 数据工程 高效处理大规模数据,通过并行计算加速数据处理过程,例如数据清洗、转换和聚合。 分布式机器学习 Ray支持分布式训练和调优,可以用于处理大规模数据集和模型,使得模型训练更加高效。 大模型 使用大模型实现智能对话、自动摘要、机器翻译、文本分类、图像生成等任务。
部署服务 功能介绍 部署一个Service实例。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST https://localhost.com/v1/work
获取模型ID 登录Fabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”,选择“资源与资产->模型”。 单击想要查询的模型查看模型详情。 查询ID字段的值获取模型ID。 图1 获取模型ID 父主题: 附录
已有可正常使用的华为云账号。 已有至少一个正常可用的工作空间。 已有至少一个可用的Ray集群。 已有至少一个可用的Job作业。 操作步骤 登录Fabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”,选择“开发与生产 > Job定义”。 在作业列表中选择一个作业,指定其运
您即将访问非华为云网站,请注意账号财产安全