搜索_华为云

Spark SQL性能调优 - MapReduce服务 MRS

Spark SQL性能调优 Spark SQL join优化优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优配置多并发客户端连接JDBCServer 配置SparkSQL的分块个数 Spark动态分区插入场景内存优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Kafka样例工程介绍 - MapReduce服务 MRS

Kafka样例工程介绍 MRS样例工程获取地址为https://github.com/huaweicloud/huaweicloud-mrs-example，切换分支为与MRS集群相匹配的版本分支，然后下载压缩包到本地后解压，即可获取各组件对应的样例代码工程。当前MRS提供以下Kafka相关样例工程：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式）
Spark on OBS性能调优 - MapReduce服务 MRS

Spark on OBS性能调优操作场景 Spark on OBS在小批量频繁请求OBS的场景下，可以通过关闭OBS监控提升性能。配置描述安装Spark客户端。详细操作请参考安装MRS客户端。使用客户端安装用户登录Spark客户端节点。在Spark客户端的“{客户端安

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
配置仅Hive管理员用户能创建库和在default库建表 - MapReduce服务 MRS

配置仅Hive管理员用户能创建库和在default库建表操作场景此功能在MRS 3.x之前版本适用于Hive，Spark。在MRS3.x及后续版本适用于Hive，Spark2x。开启此功能后，仅有Hive管理员可以创建库和在default库中建表，其他用户需通过Hive管理员授权才可使用库。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Kafka开源增强特性 - MapReduce服务 MRS

Kafka开源增强特性 Kafka开源增强特性支持监控如下Topic级别的指标： Topic输入的字节流量 Topic输出的字节流量 Topic拒绝的字节流量 Topic每秒失败的fetch请求数 Topic每秒失败的Produce请求数 Topic每秒输入的消息条数 Topic每秒的fetch请求数

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
在Linux环境中调测HBase应用 - MapReduce服务 MRS

在Linux环境中调测HBase应用操作场景 HBase应用程序支持在已安装或未安装HBase客户端的Linux环境中运行。在程序代码完成开发后，您可以上传Jar包至准备好的Linux运行环境中运行。前提条件已安装客户端时：已安装HBase客户端。当客户端所在主机不是集

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 调测HBase应用
为什么Spark Streaming应用创建输入流，但该输入流无输出逻辑时，应用从checkpoint恢复启动失败 - Spark Streaming - MapReduce服务 MRS

为什么Spark Streaming应用创建输入流，但该输入流无输出逻辑时，应用从checkpoint恢复启动失败问题 Spark Streaming应用创建1个输入流，但该输入流无输出逻辑。应用从checkpoint恢复启动失败，报错如下： 17/04/24 10:13:57

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

Set Digest函数概述 HetuEngine提供了几个处理MinHash技术的函数。 MinHash用于估计两个集合的Jaccard相似系数。它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
BulkLoad工具配置文件说明 - 增强HBase BulkLoad工具数据迁移能力 - MapReduce服务 MRS

BulkLoad工具配置文件说明配置自定义的组合rowkey 使用BulkLoad工具批量导入HBase数据时，支持用户自定义组合rowkey。BulkLoad组合rowkey即通过一些规则将多个列名经过一些自定义处理，组合生成新的rowkey。列的名称不能包含特殊字符，只能由字母、数字和下划线组成。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
BulkLoad工具配置文件说明 - 增强HBase BulkLoad工具数据迁移能力 - MapReduce服务 MRS

BulkLoad工具配置文件说明该章节主要介绍使用BulkLoad工具的其他配置操作以获取需要查看的数据。配置自定义的组合rowkey 使用BulkLoad工具批量导入HBase数据时，支持用户自定义组合rowkey。BulkLoad组合rowkey即通过一些规则将多个列名经

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
为什么Spark Streaming应用创建输入流，但该输入流无输出逻辑时，应用从checkpoint恢复启动失败 - Spark Streaming - MapReduce服务 MRS

为什么Spark Streaming应用创建输入流，但该输入流无输出逻辑时，应用从checkpoint恢复启动失败问题 Spark Streaming应用创建1个输入流，但该输入流无输出逻辑。应用从checkpoint恢复启动失败，报错如下： 17/04/24 10:13:57

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
连接postgresql或者gaussdb时报错 - Sqoop常见问题 - MapReduce服务 MRS

连接postgresql或者gaussdb时报错问题连接postgresql或者gaussdb时报错。回答场景一：（import场景）使用sqoop import命令抽取开源Postgre到MRS HDFS或Hive等。问题现象：使用sqoop命令查询postgre表可以，但是执行sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Sqoop > Sqoop常见问题
Alluixo在HA模式下出现Does not contain a valid host:port authority报错 - MapReduce服务 MRS

Alluixo在HA模式下出现Does not contain a valid host:port authority报错用户问题安全集群Alluixo在HA模式下出现Does not contain a valid host:port authority的报错，如何处理？问题现象

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Alluixo
MRS集群更换磁盘（适用于2.x及之前） - MapReduce服务 MRS

MRS集群更换磁盘（适用于2.x及之前）用户问题磁盘无法访问。问题现象客户创建本地盘系列MRS集群，其中1个Core节点的磁盘存在硬件损坏，导致读取文件失败。原因分析磁盘硬件故障。处理步骤该指导适用于MRS 3.x之前版本分析集群，如需为流式集群或混合集群更换磁盘，请联系华为云技术支持处理。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
经验总结 - Spark Core性能调优 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如： rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
连接postgresql或者gaussdb时报错 - Sqoop常见问题 - MapReduce服务 MRS

连接postgresql或者gaussdb时报错问题连接postgresql或者gaussdb时报错。回答场景一：（import场景）使用sqoop import命令抽取开源postgre到MRS hdfs或hive等。问题现象：使用sqoop命令查询postgre表可以，但是执行sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop > Sqoop常见问题
读取Hudi mor表视图 - Hudi读操作 - MapReduce服务 MRS

读取Hudi mor表视图 mor表同步给Hive后，会在Hive表中同步出：“表名+后缀_rt”和“表名+后缀_ro”两张表。其中后缀为rt表代表实时视图，后缀为ro的表代表读优化视图。例如：同步给Hive的hudi表名为${table_name}，同步Hive后hive表中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi读操作
读取Hudi mor表视图 - Hudi读操作 - MapReduce服务 MRS

读取Hudi mor表视图 mor表同步给Hive后，会在Hive表中同步出：“表名+后缀_rt”和“表名+后缀_ro”两张表。其中后缀为rt表代表实时视图，后缀为ro的表代表读优化视图。例如：同步给Hive的hudi表名为${table_name}，同步Hive后hive表中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
经验总结 - Spark Core调优 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例 rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
经验总结 - Spark Core性能调优 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优

总条数： 5445

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消