检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考按需产品周期结算说明。 示例:按小时结算的云服务器在8:30删除资源,但是8:00~9:00期间产生的费用,
计费概述 Ray、XDS计费概述 DataArtsFabric SQL计费概述
数据库系统参数调优 为了保证数据库尽可能高性能地运行,建议依据资源情况和业务实际进行数据库系统GUC参数的设置。本章节旨在介绍一些常用参数以及推荐配置,关于参数的详细设置方法请参考查看和设置GUC参数。 数据库内存相关参数 表1 数据库内存相关参数 GUC参数 描述 建议 fq_runtime
Ray场景 Ray资源管理 镜像包管理 Ray集群管理 管理Ray服务
API 服务健康检查 用户协议管理 委托管理 工作空间管理 服务规格 端点管理 模型定义 TMS管理 消息管理 监控管理 接入客户端 Service实例管理 推理服务接口 Ray Session接口 SQL业务接口
查询系统协议 功能介绍 查询租户协议内容,用户可从中了解协议名称、版本等信息。该接口为同步接口,无配套使用接口和特殊场景。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
SDK概述 数智融合服务软件开发工具包(DataArts Fabric SDK,DataArts Fabric Software Development Kit)是对DataArtsFabric服务提供的REST API进行的封装,以简化用户的开发工作。用户直接调用DataArtsFabric
计费项 Ray、XDS计费项 DataArtsFabric SQL计费项
产品规格 模型推理产品规格 表1 模型推理产品规格 类型 规格 算力 MU mu.llama3.8b 为llama3.8b模型,提供短token场景约400RPM算力。 mu.llama3.70b 为llama3.70b模型,提供短token场景约100RPM算力。 mu.llama3
模型定义 创建模型 查询模型列表 列举基模型 删除模型的指定版本 更新模型信息 查看模型版本列表 删除未使用的模型定义 父主题: API
TMS管理 查询项目标签 查询资源标签 查询资源实例列表 查询资源实例数量 批量添加资源标签 批量删除资源标签 父主题: API
GUC参数 查看和设置GUC参数 连接和认证 查询规划 客户端连接缺省设置 锁管理
台机器上扩展其应用的研究人员和工程师来说,是一个强有力的工具。同时,Ray生态系统还包括一些高级库,例如Ray Tune(用于超参数调整)、RLlib(用于强化学习)、Ray Serve(用于模型服务)等,以满足不同场景下的需求。 应用场景 Ray作为一个分布式机器学习计算框架,
消息管理 创建消息通知策略 查询消息通知策略列表 删除消息通知策略 父主题: API
准备工作 创建IAM用户并授权使用DataArtsFabric 配置DataArtsFabric服务委托权限 创建接入客户端 创建工作空间
数据+AI共享一份数据,客户无需进行数据复制。 开箱即用,资源弹性,按需使用 预置开源主流三方大模型的推理服务,客户可直接调用预置推理服务API下发文本对话等任务,无需购买资源,按需付费。 推理服务支持自动扩缩。 全托管Ray支持Pod级自动扩缩,应对客户请求波峰压力,实现资源动态分配。 S
如果没有及时地进行续费或充值,将进入宽限期。如宽限期满仍未续费或充值,将进入保留期。在保留期内资源将停止服务。保留期满仍未续费或充值,存储在云服务中的数据将被删除、云服务资源将被释放。详细说明请参考资源停止服务或逾期释放说明。宽限期与保留期的具体规则请参考宽限期保留期。 资源到期 如果账号欠费,会
函数参考 自定义函数
运维管理 设置消息通知 删除消息通知
下表列出了DataArtsFabric所有的系统权限。 表2 DataArtsFabric系统权限 系统角色/策略名称 描述 类别 依赖关系 DataArtsFabricFullPolicy DataArtsFabric服务的所有权限。 系统策略 IAM Agency Management