检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您也可以删除您不想要的模型版本。 单击页面操作列的“删除”按钮,再次确认后进行删除。 图6 删除模型入口 图7 删除模型 父主题: 创建我的推理服务进行推理
创建模型 在Fabric部署推理服务的时候除了使用公共模型,用户也可以自己创建模型。用户可以在Fabric模型页面创建模型,这些模型是属于用户个人,其他用户不可见。 约束与限制 创建模型的通用约束如下: 需要是Fabric支持的基模型,否则不支持,基模型列表如下: 表1 基模型列表
选择“资源与资产->推理端点”。 单击想要删除的推理端点右上角的垃圾桶标记,确认后删除推理端点。 图1 推理端点 父主题: 创建我的推理服务进行推理
创建推理端点 用户在创建推理服务之前,需要先创建推理端点。创建推理端点的时候可以配置最大资源数,然后在推理端点之上创建推理服务,推理端点上的所有推理服务的总资源数不能超过推理端点的最大资源数,方便用户控制推理端点的资源使用量; 前提条件 已有可正常使用的华为云账号。 已有至少一个正常可用的工作空间。
系统调优 数据库系统参数调优 SMP并行执行 父主题: 性能调优
附录 状态码 错误码 获取项目ID 获取账号ID 获取工作空间ID 获取端点ID 获取模型ID 获取推理服务实例ID 获取企业项目ID
系统视图 GET_TSC_INFO PG_LOCKS PG_NODE_ENV PG_OS_THREADS PG_ROLES PG_RULES PG_SESSION_WLMSTAT PG_SETTINGS PG_SHARED_MEMORY_DETAIL PG_STAT_ACTIVITY
系统表 PG_AGGREGATE PG_AM PG_AMOP PG_AMPROC PG_ATTRDEF PG_ATTRIBUTE PG_AUTHID PG_CAST PG_CLASS PG_COLLATION PG_CONSTRAINT PG_CONVERSION PG_DATABASE
Ray场景 Ray资源管理 镜像包管理 Ray集群管理 管理Ray服务
运维管理 设置消息通知 删除消息通知
API 服务健康检查 用户协议管理 委托管理 工作空间管理 服务规格 端点管理 模型定义 TMS管理 消息管理 监控管理 配置中心 接入客户端 Service实例管理 推理服务接口 Session接口 SQL业务接口
计费样例 以下案例中出现的费用价格仅供参考,实际价格请参见各服务价格详情。 样例1:Fabric服务Ray资源 Ray资源的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一Ray资源按需实例,fabric
SQL使用的共享内存大小。增加此参数的值会使Fabric SQL比系统默认设置需要更多的System V共享内存。 建议设置shared_buffers值为内存的40%以内。行存列存分开对待。行存设大,列存设小。列存:(单服务器内存/单服务器DN个数)*0.4*0.25。 如果设置较大的sha
应用示例 创建一个推理服务
账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考按需产品周期结算说明。 示例:按小时结算的云服务器在8:30删除资源,但是8:00~9:00期间产生的费用,
计费概述 Ray、XDS计费概述 Fabric SQL计费概述
API概览 通过使用Fabric服务所提供的接口,您可以完整的使用Fabric服务的基本功能。Fabric服务提供的具体API如表1所示。 表1 Fabric服务API概览 类型 子类型 说明 Fabric-admin 服务健康检查 服务健康检查。 用户协议管理 用户协议管理。 委托管理
什么是项目 云的每个区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以区域默认单位为项目进行授权,IAM用户可以访问您账号中该区域的所有资源。 如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买
变更配置 当前Fabric服务计费项仅支持修改RAY资源和SQL预热资源,其他业务场景都是按使用量按需计费,不涉及订单变更流程,且暂时不支持计费方式变更,因此变更配置只涉及Ray资源和SQL预热大小变更场景。 修改Ray资源或者SQL预热资源大小对费用影响如表1所示: 表1 费用影响
在查看账单后,如果您需要对某些资源停止计费可参考以下步骤: 在账单中获取资源ID或资源名称等其他资源信息。 根据上一步的信息,在云服务的控制台找到云服务资源。 将资源停止计费。 具体操作如下: RAY资源:停止RAY资源的计费,需要删除/退订RAY资源,删除后可能导致已有的RAY集群不可用。