检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DWS列存表的常用信息查询 使用列存表时,一些常用信息查询SQL示例: 先创建列存分区表my_table,并向表中插入数据。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 CREATE TABLE my_table
UPDATE 功能描述 更新HStore opt表上指定的数据。 如需使用实时数仓能力,请在DWS控制台创建集群时,选择存算一体1:4云盘规格,了解更多参见存算一体规格。 创建DWS集群选择1:8云盘规格为标准数仓,1:4云盘规格为实时数仓,以下内容描述的“实时数仓”、“标准数仓”即通过以上规格区分。
MRS集群上的数据准备 从MRS导入数据到DWS集群之前,假设您已经完成了以下准备工作: 已创建MRS集群和Lakeformation实例,并完成MRS集群和Lakeformation实例对接,具体操作请参见创建MRS集群时配置LakeFormation数据连接。 在MRS集群上创建了Spark
Synonym词典 Synonym词典用于定义、识别token的同义词并转化,不支持词组(词组形式的同义词可用Thesaurus词典定义,详细请参见Thesaurus词典)。 示例 Synonym词典可用于解决语言学相关问题,例如,为避免使单词"Paris"变成"pari",可在
验证残留文件函数 pg_verify_residualfiles(filepath) 描述:用于验证参数指定文件中记录的文件是否为残留文件。该函数为实例级函数,与当前所在的数据库相关,可以在任意实例上运行。 参数类型:text 返回值类型:bool 函数返回字段如下: 表1 pg
数据操作语句(DML) INSERT UPDATE REPLACE 引号 INTERVAL 除法表达式 GROUP BY转换 ROLLUP 父主题: MySQL语法迁移
DWS集群查询语句堆积数量超阈值。 类型 操作告警。 发生时间 告警发生时间。 附加信息 集群ID 集群resourceId、domain_id等详细信息。 对系统的影响 SQL查询阻塞,导致运行时间过长。 可能原因 业务执行过程中查询语句处于排队等待的数量超过告警阈值。 处理步骤 确认集群当前排队作业情况是否正常
GAUSS-04711 -- GAUSS-04720 GAUSS-04711: "Unsupported data type : %u." SQLSTATE: 0A000 错误原因:HDFS表不支持的数据类型。 解决办法:根据提示的信息变更定义类型为HDFS表支持类型。 GAUSS-04712:
哈希函数 hll_hash_boolean(bool) 描述:对bool类型数据计算哈希值。 返回值类型:hll_hashval 示例: 1 2 3 4 5 SELECT hll_hash_boolean(FALSE); hll_hash_boolean ---------------------
哈希函数 hll_hash_boolean(bool) 描述:对bool类型数据计算哈希值。 返回值类型:hll_hashval 示例: 1 2 3 4 5 SELECT hll_hash_boolean(FALSE); hll_hash_boolean ---------------------
SAVEPOINT 功能描述 SAVEPOINT用于在当前事务里建立一个新的保存点。 保存点是事务中的一个特殊记号,它允许将那些在它建立后执行的命令全部回滚,把事务的状态恢复到保存点所在的时刻。 注意事项 使用ROLLBACK TO SAVEPOINT回滚到一个保存点。使用RELEASE
SAVEPOINT 功能描述 SAVEPOINT用于在当前事务里建立一个新的保存点。 保存点是事务中的一个特殊记号,它允许将那些在它建立后执行的命令全部回滚,把事务的状态恢复到保存点所在的时刻。 注意事项 使用ROLLBACK TO SAVEPOINT回滚到一个保存点。使用RELEASE
SQL执行很慢,性能低,有时长时间运行未结束 问题现象 SQL执行很慢,性能低,有时长时间运行未结束。 原因分析 SQL运行慢可从以下几方面进行分析: 使用EXPLAIN命令查看SQL执行计划,根据执行计划判断是否需要进行SQL调优。 分析查询是否被阻塞,导致语句运行时间过长,可以强制结束有问题的会话。
DWS表设计规则 DWS是分布式架构。数据分布在各个DN上。总体上讲,良好的表设计需要遵循以下原则: 【关注】将表数据均匀分布在各个DN上。数据均匀分布,可以防止数据在部分DN上集中分布,从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列,可以避免数据倾斜。 【关注】将
支持的数据类型 目前大数据领域,主流文件格式为ORC、PARQUET。用户利用HIVE将数据导出存储为ORC、PARQUET文件格式,使用GaussDB(DWS)通过只读外表对ORC、PARQUET文件内的数据进行查询分析,因此,需要在ORC、PARQUET文件格式支持的数据类型
案例:调整GUC参数best_agg_plan 现象描述 t1的表定义为: 1 create table t1(a int, b int, c int) distribute by hash(a); 假设agg下层算子所输出结果集的分布列为setA,agg操作的group by
DWS SQL编写规则 DDL 【建议】在DWS中,建议DDL(建表、comments等)操作统一执行,在批处理作业中尽量避免DDL操作。避免大量并发事务对性能的影响。 【建议】在非日志表(unlogged table)使用完后,立即执行数据清理(truncate)操作。因为在异
GaussDB(DWS) SQL编写规则 DDL 【建议】在GaussDB(DWS)中,建议DDL(建表、comments等)操作统一执行,在批处理作业中尽量避免DDL操作。避免大量并发事务对性能的影响。 【建议】在非日志表(unlogged table)使用完后,立即执行数据清
索引使用约束 下面是一个使用索引的例子,由于SQL_ASCII的数据库编码格式不支持中文字符,请在Encoding为UTF8/GBK的数据库中执行以下示例: 1 2 3 4 5 6 7 8 9 10 11 12 create table table1 (c_int
gds_uninstall 背景信息 gds_uninstall是用于批量卸载GDS的脚本工具。 注意事项 执行脚本前需设置环境变量,可参考安装配置和启动GDS章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本gds_uninstall。 必须包含--host、-U参数。