检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
行数据倾斜检查和调整分布列,避免导入大量数据后发现数据倾斜,调整成本高。 前提条件 GDS服务器和DWS集群之间网络可以互通。 需要创建一个弹性云服务器作为GDS服务器。 创建的弹性云服务器与DWS集群应处于同一区域、同一虚拟私有云和子网。 操作步骤 在DWS中创建目标表,用于存
执行导出数据 前提条件 需要确保每一个CN和DN所在服务器到GDS服务器的IP和端口是互通的。 导出操作语法 执行数据导出语法: 1 INSERT INTO [foreign table 表名] SELECT * FROM [源表名]; 编写批处理任务脚本,实现并发批量导出数
00:00(北京时间)正式停止维护,当前支持维护的集群版本请参见版本生命周期。 若您账号下存在8.1.1.x及之前的集群版本,为了保证您的服务权益,建议尽快升级到在维的商用版本。关于如何升级集群,请参见DWS集群升级指导。 父主题: 集群版本公告
00:00(北京时间)正式停止维护,当前支持维护的集群版本请参见版本生命周期。 若您账号下存在8.0.1.x及之前的集群版本,为了保证您的服务权益,建议尽快升级到在维的商用版本。关于如何升级集群,请参见DWS集群升级指导。 父主题: 集群版本公告
CheckMetaData 检查系统表元数据是否一致,如果一致,则检查通过,否则检查不通过。 CheckGUCSetting postgresql.conf中GUC参数和pg_settings中参数是否一致,一致则检查通过,否则不通过。 CheckProacl 检查pg_proc系统表中proac
创建弹性云服务器ECS和数据仓库DWS 创建弹性云服务器ECS 创建数据仓库DWS 父主题: 测试方法
sql的执行超时,即statement query timeout。 0 readSyncThreadEnable 非异步查询时,是否开启线程池 boolean 开启后future.get()异步阻塞,关闭后主线程同步调用阻塞。 true lookupScanEnable 是否开启scan查询 boolean 关联
示例:创建GDS导出外表foreign_tpcds_reasons,待导出数据格式为CSV,用于接收数据服务器上的数据。 其中设置的导出模式信息如下所示: 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90,待导出的数据文件格式为CSV,选择并行导出模式为Remote模式。
8.1.2.x 扩容时重新拉起重分布进程,生成表清单的时候,卡住1小时以上。 生成表清单语句是查询系统表后插入pgxc_redistb,pgxc_redistb是分布式表,查询系统表都是在CN上执行,再插入分布式表时每条记录都要执行一个INSERT INTO ... VALUES语句,如果表数量非常大会非常耗时。
数据库用户管理 数据迁移 数据仓库服务 数据仓库服务(Data Warehouse Service,简称DWS)是一种基于公有云基础架构和平台的在线数据处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务。DWS是基于华为融合数据仓库GaussDB产品的云原生服务,兼容标准ANSI SQL
历史版本兼容性 DWS介绍数据库的向下兼容性和对外兼容性特性的参数控制。数据库系统的向后兼容性能够为旧版本的数据库应用提供支持。本节介绍的参数主要控制数据库的向后兼容性。 array_nulls 参数说明:控制数组输入解析器是否将未用引用的NULL识别为数组的一个NULL元素。 参数类型:USERSET
USER_TABLES USER_TRIGGERS USER_VIEWS V$SESSION V$SESSION_LONGOPS 父主题: DWS系统表和系统视图
数据量大,数据存储在多个服务器上时,在每个数据服务器上安装配置、启动GDS后,各服务器上的数据可以并行入库。如图2所示。 图2 多数据服务器并行导入 GDS进程数目不能超过DN数目。如果超过,会出现一个DN连接多个GDS进程的情形,可能会导致部分GDS异常运行。 数据存储在一台数据服务器上时,如
DWS支持的导出模式有Remote模式。 Remote模式:将集群中的业务数据导出到集群之外的主机上。 支持多个GDS服务并发导出,但1个GDS在同一时刻,只能为1个集群提供导出服务。 配置与集群节点处于统一内网的GDS服务,导出速率受网络带宽影响,推荐的网络配置为10GE。 支持数据文件格式:TEXT、CSV和FIXED。单行数据大小需<1GB。
DECIMAL(15,2) NOT NULL, L_TAX DECIMAL(15,2) NOT NULL, L_RETURNFLAG CHAR(1) NOT NULL, L_LINESTATUS CHAR(1) NOT NULL, L_SHIPDATE
集合使用原则: 引用集合中的元素时宜使用FORALL语句,不宜使用FOR循环语句。 动态语句使用原则: 联机系统的交易程序不宜使用动态SQL。 PL/PGSQL中要实现DDL语句和系统控制命令,可使用动态SQL。 宜尽量使用变量绑定。 拼装SQL的使用原则: 拼装SQL宜使用绑定变量。
出现数据格式错误的时间。 filename character varying 出现数据格式错误的数据源文件名。 当GDS导入时,同时会包括对应GDS服务端的IP地址端口信息。 rownum bigint 在数据源文件中,出现数据格式错误的行号。 rawrecord text 在数据源文件中,出现数据格式错误的原始记录。
三权分立下,非管理员无权查看系统表和视图。非三权分立下,系统表和系统视图要么只对管理员可见,要么对所有用户可见。下面的系统表和视图有些标识了需要管理员权限,这些系统表和视图只有管理员可以查询。 禁止对系统表或系统视图进行增删改等操作,手动对系统表或系统视图的修改或破坏可能会导致系统信息不一致,造
系统操作 GaussDB(DWS)通过SQL语句执行不同的系统操作,比如:设置变量,显示执行计划和垃圾收集等操作。 设置变量 设置会话或事务中需要使用的各种参数,请参考SET。 显示执行计划 显示GaussDB(DWS)为SQL语句规划的执行计划,请参考EXPLAIN。 事务日志检查点
Remote模式导出 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90,导出数据文件格式为CSV,所以规划的并行导出模式为Remote模式。 Remote模式并行导出数据操作示例如下所示: 以root用户登录GDS数据服务器,创建数据文件存放目录“/ou