搜索_华为云

设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

设置并行度操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark常用命令介绍 - MapReduce服务 MRS

Spark常用命令介绍 Spark命令详细的使用方法参考官方网站的描述：http://spark.apache.org/docs/latest/quick-start.html。常用命令 Shell命令执行方法：进入Spark客户端目录。初始化环境变量。 source /opt

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

对系统的影响修改磁盘选择策略为“节点磁盘可用空间块放置策略（org.apache.hadoop.hdfs.server.blockmanagement.AvailableSpaceBlockPlacementPolicy）”，经过测试验证，在该测试结果中，修改前后，HDFS写文件性能影响范围在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
创建CarbonData表 - MapReduce服务 MRS

系统默认为String类型的列做字典编码，但是如果字典值过多，会导致字典转换操作增加造成性能下降。一般情况下，列的数值复杂度高于5万，可以被认定为高复杂度，则需要排除掉字典编码，该参数为可选参数。说明：在非字典列中，只支持String和Timestamp数据类型。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
配置Hive读取关系型数据库数据 - MapReduce服务 MRS

表的列与关系型数据库表的列进行匹配（可忽略） "qubit.sql.column.mapping" = "id=name", -- 关系型数据库用户 "qubit.sql.dbcp.username" = "test", -- 关系型数据库密码，命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
配置Yarn模式下Spark动态资源调度 - MapReduce服务 MRS

动态资源调度就是为了解决这种场景，根据当前应用任务的负载情况，实时的增减Executor个数，从而实现动态分配资源，使整个Spark系统更加健康。操作步骤需要先配置External shuffle service。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
什么是区域和可用区？ - MapReduce服务 MRS

一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。图1表示区域和可用区之间的关系。图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。如何选择区域？

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
查看历史MRS集群信息 - MapReduce服务 MRS

集群ID 集群的唯一标识，创建集群时系统自动赋值，不需要用户设置。创建时间显示集群创建的时间。订单号显示创建集群的订单号。该参数仅在“付费类型”为“包年/包月”时显示。可用区集群工作区域下的可用区，创建集群时设置。默认生效子网子网信息，创建集群时所选。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
配置MapReduce通过IAM委托访问OBS - MapReduce服务 MRS

创建表： create table test(name string) location "obs://OBS并行文件系统名称/user/hive/warehouse/数据库名/表名"; 表创建成功后，可执行以下命令查看表的Location： desc formatted test

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
配置Mapreduce通过Guardian访问OBS - MapReduce服务 MRS

创建表： create table test(name string) location "obs://OBS并行文件系统名称/user/hive/warehouse/数据库名/表名"; 表创建成功后，可执行以下命令查看表的Location： desc formatted test

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过Guardian对接OBS > MRS集群服务对接OBS示例
如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？ - MapReduce服务 MRS

如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？问题如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？原因分析由于窗口使用自定义窗口

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
MRS集群组件如何管理和使用第三方jar包 - MapReduce服务 MRS

MRS集群组件如何管理和使用第三方jar包 MRS集群内部分组件支持使用自定义的第三方jar包来满足组件的定制化需求，如果用户应用在使用组件时调用了第三方jar包，可放置到每个节点上指定目录中，重启组件后该目录下的jar会被相应的组件程序自动加载。放置目录为：组件安装节点的“<集群安装目录

 帮助中心 > MapReduce服务 MRS > 常见问题 > 应用开发类
创建FlinkServer作业 - MapReduce服务 MRS

系统默认开启作业锁功能，可在Manager查看该功能启用状态。适用于MRS 3.3.0及以后版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

若导入任务在设定的时间内未完成则会被系统取消，状态变为“CANCELLED”。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

在Manager界面选择“系统 > 权限 > 角色”创建一个Hive角色（例如“hiverole”），详细操作请参考创建Hive角色。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
查询Impala数据 - 开发Impala应用 - MapReduce服务 MRS

查询Impala数据功能简介本小节介绍了如何使用Impala SQL对数据进行查询分析。从本节中可以掌握如下查询分析方法。 SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Impala自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见开发

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
查询Impala数据 - 开发Impala应用 - MapReduce服务 MRS

查询Impala数据功能简介本小节介绍了如何使用Impala SQL对数据进行查询分析。从本节中可以掌握如下查询分析方法。 SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Impala自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用

总条数： 3568

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消