搜索_华为云

Spark Python API接口介绍 - Spark常用API介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Storm-HDFS开发指引 - MapReduce服务 MRS

eytab。 Kerberos服务的renewable、forwardable开关和票据刷新周期的设置在Kerberos服务的配置页面的“系统”标签下，票据刷新周期的修改可以根据实际情况修改“kdc_renew_lifetime”和“kdc_max_renewable_life”的值。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
Spark Python API接口介绍 - Spark常用API介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Receiver将数据流分成一系列小块，存储到Executor内存中。另外，在启用预写日志（Write-ahead Log，简称WAL）以后，数据同时还写入到容错文件系统的预写日志中。通知Driver（绿色箭头）接收块中的元数据（Metadata）被发送到Driver的StreamingContext。这个元数据包括：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。通过Kerberos模式认证： ./sqoop2-shell -uk true -k user.keytab -s userPrincipal 系统显示如下信息： Welcome to sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

（仅hash方式）若要合并在shuffle过程中创建的中间文件，需要将该值设置为“true”。文件创建的少可以提高文件系统处理性能，降低风险。使用ext4或者xfs文件系统时，建议设置为“true”。由于文件系统限制，在ext3上该设置可能会降低8核以上机器的处理性能。 false spark.shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置矢量化读取ORC数据 - MapReduce服务 MRS

impl”：指定使用Hive还是Spark SQL native作为SQL执行引擎来读取ORC数据，默认为hive。配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数说明默认值取值范围

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
创建CarbonData表 - MapReduce服务 MRS

级别用256，TB级别用512，PB级别用1024。 DICTIONARY_EXCLUDE 设置指定列不生成字典，适用于数值复杂度高的列。系统默认为String类型的列做字典编码，但是如果字典值过多，会导致字典转换操作增加造成性能下降。一般情况下，列的数值复杂度高于5万，可以被

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
配置Hive读取关系型数据库数据 - MapReduce服务 MRS

dbcp.username" = "test", -- 关系型数据库密码，命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。 "qubit.sql.dbcp.password" = "xxx"); 父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

点磁盘可用空间块放置策略”，可提高将块数据写到磁盘可用空间较大节点的概率，解决因为数据节点磁盘容量不一致导致的节点使用率不均衡的情况。对系统的影响修改磁盘选择策略为“节点磁盘可用空间块放置策略（org.apache.hadoop.hdfs.server.blockmanagement

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
查看历史MRS集群信息 - MapReduce服务 MRS

显示创建集群时的付费类型，目前支持“按需计费”和“包年/包月”。集群版本集群的版本信息。集群类型创建集群时的集群类型。集群ID 集群的唯一标识，创建集群时系统自动赋值，不需要用户设置。创建时间显示集群创建的时间。订单号显示创建集群的订单号。该参数仅在“付费类型”为“包年/包月”时显示。可用区

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
配置MapReduce通过IAM委托访问OBS - MapReduce服务 MRS

创建Hive表并向表中插入数据。创建表： create table test(name string) location "obs://OBS并行文件系统名称/user/hive/warehouse/数据库名/表名"; 表创建成功后，可执行以下命令查看表的Location： desc formatted

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
配置Mapreduce通过Guardian访问OBS - MapReduce服务 MRS

创建Hive表并向表中插入数据。创建表： create table test(name string) location "obs://OBS并行文件系统名称/user/hive/warehouse/数据库名/表名"; 表创建成功后，可执行以下命令查看表的Location： desc formatted

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过Guardian对接OBS > MRS集群服务对接OBS示例
配置Yarn模式下Spark动态资源调度 - MapReduce服务 MRS

度。动态资源调度就是为了解决这种场景，根据当前应用任务的负载情况，实时的增减Executor个数，从而实现动态分配资源，使整个Spark系统更加健康。操作步骤需要先配置External shuffle service。使用动态资源调度功能，必须配置External Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
在Windows中调测Impala JDBC应用 - MapReduce服务 MRS

在弹性云服务管理控制台，创建一个新的弹性云服务器。弹性云服务器的“可用分区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。其他配置参数详细信息，请参见自定义购买弹性云服务器。方法二：使用本机访问MRS集群操作Impala，在安装开发环境后并完成以下步骤后再运行样例代码。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 调测Impala应用
创建FlinkServer作业 - MapReduce服务 MRS

进行作业开发时，系统支持对作业添加锁的功能，锁定作业的用户具备该作业的所有权限，其他用户不具备被锁定的作业的开发、启动和删除等权限，但可通过强制获取锁来具备作业的所有权限。开启该功能后，可直接通过单击“锁定作业”、“解锁作业”、“强制获取锁”来获取相应的权限。系统默认开启作业锁功

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Spark Python API接口介绍 - Spark常用API介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

用户名为dorisuser），并修改初始密码。登录Doris集群Manager页面，详细操作请参考访问MRS集群Manager。选择“系统 > 权限 > 角色 > 添加角色”，填写角色名称，如“dorisrole”，在“配置资源权限”选择“待操作的集群 > Doris”，勾选

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

登录集群Manager页面，详细操作请参考访问MRS集群Manager。在Manager界面选择“系统 > 权限 > 角色”创建一个Hive角色（例如“hiverole”），详细操作请参考创建Hive角色。选择“系统 > 权限 > 用户 > 添加用户”，根据界面提示创建一个人机用户（例如hive

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析

总条数： 2723

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消