检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建一个推理服务 概述 本文指导用户通过调用API的方式,介绍创建一个推理服务的完整流程。 本流程假设终端租户已经在Console界面完成Fabric的服务授权。API的调用方法请参见如何调用API。 前提条件 hostname:通过地区和终端节点查询服务的终端节点获取。 操作步骤
ICEBERG表服务函数 iceberg_expire_snapshots 描述:Iceberg每个commit都会生成一个新快照,同时保留旧数据和元数据,以便进行快照隔离和time travel。expire snapshots可以用来清理不再需要的旧快照以及仅被不需要快照包含的数据文件,以提高查询、成本效率。
配置DataArtsFabric服务委托权限 当前云服务提供多种功能,不同的功能需要不同的委托权限。详细见表1。 前提条件 已有可正常使用的华为云账号。 操作步骤 登录DataArtsFabric工作空间管理台,单击“服务授权”。 图1 服务授权界面 在“服务授权”页面配置授权委托。用
获取推理服务实例ID 登录Fabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”,选择“资源与资产->推理实例”。 单击想要查询的推理实例查看推理实例详情。 查询推理实例ID字段的值获取推理实例ID。 图1 获取推理服务实例ID 父主题: 附录
使用推理服务的权限配置示例 场景描述 假设某个公司需要使用DataArtsFabric服务,有如下需求: 张三作为IAM权限管理员,需要在DataArtsFabric页面进行服务授权并为各种不同的角色配置好对应的IAM权限。 李四作为开发工程师,需要创建工作空间,搭建一套Ray集群。
更新已部署的服务实例 功能介绍 更新已部署的服务实例。用户可以通过该接口更新已部署的服务实例,包括名称和描述等。此接口为异步接口,配套使用接口ShowServiceInstanceDetail,ListServicesInstances来查询服务实例具体情况。目前暂不支持更新实例最小数和模型版本。
用公共推理服务进行推理 查看公共推理服务 开通推理服务 在试验场进行推理 父主题: 大模型推理场景
查看部署的服务实例详情 功能介绍 查看部署后的服务实例的详情。返回服务实例的详情信息。此接口为同步接口,无配套使用接口和特殊场景。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
创建我的推理服务进行推理 创建模型 管理模型 创建推理端点 创建推理服务 使用推理服务进行推理 删除推理服务 删除推理端点 父主题: 大模型推理场景
创建函数时,建议指定schema,否则会在默认的schema default_db下创建函数。调用自定义函数时必须指定schema,否则系统会调用系统内置函数。 argname 函数参数的名字。 字符串,需符合标识符的命名规范。 argtype 函数参数的类型。 详情请参见数据类型映射。
signature参数的类型推断 对于signature参数,允许用户传入参数/返回值类型,也允许用户不传入。 如果用户传入signature参数,不需要原始Python函数使用类型注解(type hints)语法,此时可以支持及时操作式的注册UDF。 如果用户不传入signat
列举已部署的服务实例 功能介绍 列举已部署的服务实例列表。用户可通过该接口列举已部署的服务实例列表,接口支持分页查询、支持通过名称、服务实例ID、端点ID、可见性查询。支持排序。返回为符合过滤条件的服务实例列表。此接口为同步接口,无配套使用接口。支持查询公共的服务实例。 调试 您可以在API
系统表 PG_AGGREGATE PG_ATTRIBUTE PG_AUTHID PG_CLASS PG_COLLATION PG_DATABASE PG_FOREIGN_DATA_WRAPPER PG_FOREIGN_SERVER PG_NAMESPACE PG_OPCLASS PG_OPERATOR
系统调优 数据库系统参数调优 SMP并行执行 父主题: 性能调优
健康检查 功能介绍 查看系统健康状态,用户可通过该接口查看系统健康状态。此接口为同步接口,无配套使用接口和特殊场景。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET
约束限制:输入token和生成token的总长度受模型的上下文长度限制。 取值范围:不涉及。 默认取值:不涉及。 temperature 否 Double 参数解释:Temperature是用于调整随机程度的数字。介于0和2之间。较高的值(如0.8)将使输出更随机,而较低的值(如0.2)将使输出更集中和确定性。
已有至少一个正常可用的工作空间。 已开通公共推理服务,开通流程请参见开通推理服务。 操作步骤 登录DataArtsFabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”。 在左侧菜单栏中选择“推理服务> 公共推理服务”,进入“公共推理服务”"页面。 图1 查看公共推理服务 单击“试验场”,进入“试验场”页面,进行推理操作。
赋予对应column的一个有效表达式或值: 向表中字段插入单引号时需要使用单引号自身进行转义。 如果插入行的表达式不是正确的数据类型,系统试图进行类型转换,如果转换不成功,则插入数据失败,系统返回错误信息。 示例: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
TABLE创建了一个表web_returns_p1,并以ORC文件格式存储数据。 1 2 3 4 5 6 7 CREATE TABLE web_returns_p1 ( wr_returned_date_sk integer, wr_returned_time_sk
在左侧菜单栏选择“开发与生产 > 推理服务”,然后在页面右上角单击“创建推理服务”,填写推理服务的名称、描述等基本信息,并选择推理端点和模型,配置资源最小值和最大值,单击“立即创建”。 “模型类型”支持选择“我的模型”或者“公共模型”。 在左侧菜单栏选择“开发与生产 > 试验场”,选择目标推理服务进行推理调试。