检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
逻辑操作符 常用的逻辑操作符有AND、OR和NOT,其运算结果有三个值,分别为TRUE、FALSE和NULL,其中NULL代表未知。运算优先级顺序为:NOT>AND>OR。 运算规则请参见表1,表中的a和b代表逻辑表达式。 表1 运算规则表 a b a AND b的结果 a OR
XML谓词 本节的函数用户检查xml值的属性。 xml IS DOCUMENT 描述:如果参数XML值是一个正确的XML文档,则IS DOCUMENT返回真;如果非正确XML文档,则返回假;参数为空时返回空。 返回值类型:bool 1 2 3 4 5 SELECT '<abc/>'
漏斗和留存函数 漏斗和留存相关函数仅8.3.0及以上集群版本支持。 windowfunnel windowfunnel函数用于在滑动的时间窗口中搜索事件列表并计算条件匹配的事件列表的最大长度。DataArtsFabric SQL根据用户定义的事件列表,从第一个事件开始匹配,依次做
行表达式 语法: row_constructor operator row_constructor 两边都是一个行构造器,两行值必须具有相同数目的字段,每一行都进行比较,行比较允许使用=,<>,<,<=,>=等操作符,或其中一个相似的语义符。 =<>和别的操作符使用略有不同。如果
DQL语法一览表 DQL(Data Query Language数据查询语言),用于从表或视图中获取数据。 查询 DataArtsFabric SQL提供了用于从表或视图中获取数据的语句。 具体信息,请参见SELECT。 父主题: DQL语法
查看SQL运行情况 登录DataArtsFabric工作空间管理台,在目标工作空间卡片单击“进入工作空间”。 在左侧导航栏选择“开发与生产 > 会话管理”。 图1 会话管理 在操作列单击“SQL运行情况”,查看指定会话下SQL的运行信息,包括查询语句、状态、提交时间等。 (可选)
vpc_id String 参数解释:服务接入客户端的vpcID。 约束限制:不涉及。 取值范围:长度为[1,64]的英文字符、数字和中划线(-)的组合。 默认取值:不涉及。 subnet_ids Array of strings 参数解释:服务接入客户端的子网ID,多个子网用“,”连接。
参数解释:创建用户名称。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 metastore_id String 参数解释:LakeFormation服务的实例ID,即MetaStoreID。 约束限制:不涉及。 取值范围:长度为[32,36]的字母、数字、中划线(-)组合。 默认取值:不涉及。
SDK首次发布 无 使用前须知: 使用前请确认您已经开通并有权限使用DataArtsFabric SQL服务,包括DataArtsFabric SQL会涉及的Lakeformation服务和OBS服务等。 请确认您已了解DataArtsFabric SQL中的一些基本概念,如工作空间(Wor
返回集合的函数 序列号生成函数 下标生成函数 父主题: 函数和操作符
数组表达式 IN expression IN (value [, ...]) 右侧括号中的是一个表达式列表。左侧表达式的结果与表达式列表的内容进行比较。如果列表中的内容符合左侧表达式的结果,则IN的结果为true。如果没有相符的结果,则IN的结果为false。 示例如下: 1 2
准备工作 准备Python环境 安装DataFrame包依赖Python 3.11环境,使用前请提前安装好Python 3.11。 安装DataFrame包 在线安装: 通过华为内部源使用pip进行安装: pip install --trusted-host pypi.cloudartifact
创建SQL端点 在使用DataArtsFabric SQL服务的时候除了使用公共端点,用户也可以自己创建端点。这些端点是属于用户个人,其他用户不可见。 登录华为云DataArtsFabric控制台,选择进入工作空间。 左侧选择“资源与资产 > SQL端点”。 单击“创建端点”",
创建、清空、删除Iceberg表 Iceberg表将数据存储在OBS上。DataArtsFabric SQL可以直接访问OBS上的Iceberg数据。 创建Iceberg表 通过CREATE TABLE语法创建Iceberg表。与其他格式的表相比,创建Iceberg表没有特别的参数需要指定,只需要指定STORE
加载驱动 在创建数据库连接之前,需要先加载数据库驱动程序。 加载驱动有两种方法: 在代码中创建连接之前任意位置隐含装载:Class.forName("org.postgresql.Driver"); 在JVM启动时参数传递:java -Djdbc.drivers=org.postgresql
执行计划算子 算子介绍 SQL执行计划中每一个步骤为一个数据库运算符,也叫做一个执行算子。DataArtsFabric SQL中算子是基本的数据处理单元,合理地组合算子、优化算子的顺序和执行方式,可以提升数据的处理效率。 DataArtsFabric SQL算子可分为:扫描算子、
子查询调优 子查询背景介绍 应用程序通过SQL语句来操作数据库时会使用大量的子查询,这种写法比直接对两个表做连接操作在结构上和思路上更清晰,尤其是在一些比较复杂的查询语句中,子查询有更完整、更独立的语义,会使SQL对业务逻辑的表达更清晰更容易理解,因此得到了广泛的应用。 DataArtsFabric
使用Plan Hint进行调优 Plan Hint调优概述 Join顺序的Hint Join方式的Hint 行数的Hint Stream方式的Hint 子链接块名的hint 指定子查询不提升的hint 配置参数的hint Hint的错误、冲突及告警 父主题: SQL调优
场景实践 不带UDF的DF示例 带Scalar UDF的DF示例 直接使用带Scalar UDF的DF示例 父主题: DataArtsFabric DataFrame
SQL语句改写规则 根据数据库的SQL执行机制以及大量的实践,总结发现:通过一定的规则调整SQL语句,在保证结果正确的基础上,能够提高SQL执行效率。如果遵守下列规则,能够大幅度提升业务查询效率。 使用union all代替union union在合并两个集合时会执行去重操作,而union