消息管理 创建消息通知策略 查询消息通知策略列表 删除消息通知策略 父主题: API
准备工作 创建IAM用户并授权使用Fabric 配置Fabric服务委托权限 创建工作空间
模型定义 创建模型 列举模型 列举基模型 删除模型版本 更新模型 查询模型的版本列表 删除未使用的模型定义 父主题: API
Session接口 获取session信息,由最终租户调用 父主题: API
TMS管理 查询项目标签 查询资源标签 查询资源实例列表 查询资源实例数量 批量打资源标签 批量删除资源标签 父主题: API
在账单中获取资源ID或资源名称等其他资源信息。 根据上一步的信息,在云服务的控制台找到云服务资源。 将资源停止计费。 具体操作如下: RAY资源:停止RAY资源的计费,需要删除/退订RAY资源,删除后可能导致已有的RAY集群不可用。 推理MU时:删除推理端点下的推理服务实例或者删除推理端点后,则不会产生费用。
应用场景 本节介绍Fabric服务的主要应用场景。 数据工程 高效处理大规模数据,通过并行计算加速数据处理过程,例如数据清洗、转换和聚合。 分布式机器学习 Ray支持分布式训练和调优,可以用于处理大规模数据集和模型,使得模型训练更加高效。 大模型 使用大模型实现智能对话、自动摘要、机器翻译、文本分类、图像生成等任务。
委托管理 创建服务委托 查询服务委托 删除服务委托 父主题: API
配置中心 查询用户支持特性 父主题: API
端点管理 查询Endpoint列表 创建Endpoint 查询Endpoint详情 修改Endpoint 删除Endpoint 订阅Endpoint 父主题: API
监控管理 更新AOM监控采集配置 父主题: API
如何调用API 构造请求 认证鉴权 返回结果
大模型推理场景 大模型推理场景介绍 用公共推理服务进行推理 创建我的推理服务进行推理 通过AOM查看全量指标
变更配置 当前Fabric服务计费项仅支持修改RAY资源,其他业务场景都是按使用量按需计费,不涉及订单变更流程,且暂时不支持计费方式变更,因此变更配置只涉及Ray资源大小变更场景。 修改Ray资源大小对费用影响如表1所示: 表1 费用影响 当前计费模式 变更场景 对费用的影响 按需
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 current_version_id 否 String 参数解释:模型版本ID。 约束限制:系统自动生成无法修改,输入不生效。 取值范围:32~36位的英文、数字、中划线(-)组合。 默认取值:不涉及。 version 否 ModelVersionInput
源将停止服务。保留期满仍未续费或充值,存储在云服务中的数据将被删除、云服务资源将被释放。详细说明请参考资源停止服务或逾期释放说明。宽限期与保留期的具体规则请参考宽限期保留期。 资源到期 如果账号欠费,会根据“客户等级”定义不同的保留期时长。进入保留期后您在Fabric服务中创建的
计费项 Fabric服务根据RAY、推理业务场景有不同的策略进行计费。详细的计费项及说明请参考表1。每个计费项的详细价格请参考产品价格详情。 表1 计费项信息 计费项 计费说明 RAY资源 此处根据您创建的RAY资源规格和数量按照使用时间进行计费,不同的数据处理单元或AI计算单元
* MU换算比例 * 实际使用时长,按秒计费。 使用30分钟,部署1个模型服务实例且数量无变化,根据实际使用时长按秒计费:(1/3600)*1*2*30*60=30元。 使用1小时,其中一段15分钟时间内,服务实例数为2,剩余时间内实例数为1,根据实际使用时长按秒计费:(30/3600)*1*2*45*60
Service实例管理 列举已部署的Service实例 查看部署的Service实例详情 部署服务 更新Service实例 删除Service实例 父主题: API
您即将访问非华为云网站,请注意账号财产安全