搜索_华为云

调测Hive Python3样例程序 - MapReduce服务 MRS

调测Hive Python3样例程序 Python3样例工程的命令行形式运行赋予“python3-examples”文件夹中脚本的可执行权限。在命令行终端执行以下命令： chmod +x python3-examples -R。将“python3-examples/pyCLI_nosec.py

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 调测Hive应用
快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

选择“系统 > 权限 > 角色”。单击“添加角色”，配置如下参数创建一个角色，详情请参见创建角色。填写角色的名称，例如mrrole。

帮助中心 > MapReduce服务 MRS > 快速入门
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明用户自定义JDBCServer的客户端，使用JDBC连接来进行数据表的创建、数据加载、查询和删除。数据规划确保以HA模式启动了JDBCServer服务，并至少有一个实例对外服务。在hdfs上创建"/home/data"目录，新增包含如下内容的文件并上传到hdfs

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 通过JDBC访问Spark SQL的程序
快速开发ClickHouse应用 - MapReduce服务 MRS

在FusionInsight Manager界面选择“系统 > 权限 > 角色 > 添加角色”。填写角色的名称，例如developrole，单击“确定”保存角色。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
配置NodeManager角色实例使用的资源 - MapReduce服务 MRS

对系统的影响保存新的配置需要重启NodeManager角色实例，此时对应的角色实例不可用。操作步骤 MRS 3.x之前的版本集群执行以下操作：登录MRS控制台，选择“现有集群”，单击集群名称。选择“组件管理 > Yarn > 实例”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
配置parquet表的压缩格式 - MapReduce服务 MRS

配置参数登录FusionInsight Manager系统。详细操作请参考访问集群Manager。选择“集群 > 服务 > Spark2x/Spark > 配置”，单击“全部配置”，搜索并调整以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置HDFS用户访问HDFS文件权限 - MapReduce服务 MRS

hdfs dfs -chmod 1777 /user 为了系统文件的安全，建议用户将非临时目录进行安全加固，例如： /user：777 /mr-history：777 /mr-history/tmp：777 /mr-history/done：777 /user/mapred：755

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS用户权限管理
配置多主实例与多租户模式切换 - MapReduce服务 MRS

配置描述登录FusionInsight Manager系统。详细操作请参考访问集群Manager。选择“集群 > 服务 > Spark2x/Spark > 配置”，单击“全部配置”，搜索并调整以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用
准备本地应用开发环境 - MapReduce服务 MRS

登录MRS Manager系统。选择“服务管理 > 下载客户端 ”，下载“完整客户端”到“远端主机”上，即下载客户端程序到新申请的弹性云服务器上。以root用户安装集群客户端。执行以下命令解压客户端包。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 准备Impala应用开发环境
修改MRS角色实例参数 - MapReduce服务 MRS

对系统的影响修改角色实例配置后，如果实例状态为“配置过期”，则需要重启此实例。重启时对应的实例不可用。配置HBase、HDFS、Hive、Spark、Yarn、Mapreduce服务属性后，需要重新下载并更新客户端配置文件。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
使用广播变量 - MapReduce服务 MRS

使用广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

对系统的影响启用集群间复制功能需要重启Yarn，服务重启期间无法访问。前提条件两个集群HDFS的参数“hadoop.rpc.protection”需使用相同的数据传输方式。设置为“privacy”表示加密，“authentication”表示不加密。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

数据源为文件系统，该参数才有效。用户如果需增量导入数据建议设置该参数。例如设置为“.txt”，源文件为“test-loader.csv”，则导出后源文件名为“test-loader.csv.txt”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad Data，或者在发现Bad Data时让数据加载失败。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

配置Spark对接OBS文件系统。如果集群不存在Spark组件请跳过该步骤。在FusionInsight Manager界面，选择“集群 > 服务 > Spark > 配置 > 全部配置”。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
添加HBase数据源 - MapReduce服务 MRS

选择“系统 > 权限 > 用户”。选择对应的数据源用户，在“操作”列中选择“更多 > 下载认证凭据”。从下载的文件中解压获取“user.keytab”和“krb5.conf”文件。数据源的代理用户需要具有对HBase的相关操作权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到合适。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

配置参数参数入口：在Manager系统中，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，在搜索框中输入参数名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置多主实例模式 - MapReduce服务 MRS

配置描述登录FusionInsight Manager系统。详细操作请参考访问集群Manager。选择“集群 > 服务 > Spark2x/Spark > 配置”，单击“全部配置”，搜索并调整以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用

总条数： 3568

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消