搜索_华为云

cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
创建HDFS文件并写入内容 - 开发HDFS应用 - MapReduce服务 MRS

创建HDFS文件并写入内容功能简介写文件过程为：使用FileSystem实例的create方法获取写文件的输出流。使用该输出流将内容写入到HDFS的指定文件中。在写完文件后，需关闭所申请资源。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
Spark增量读取Hudi参数规范 - MapReduce服务 MRS

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例 set hoodie.tableName.consume.mode=INCREMENT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
Spark从Hive读取数据再写入HBase样例程序（Python） - Spark从Hive读取数据再写入HBase样例程序 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？问题为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？回答 Spark SQL对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
如何在导入Hive表时指定输出的文件压缩格式？ - MapReduce服务 MRS

如何在导入Hive表时指定输出的文件压缩格式？问题现象如何在导入Hive表时指定输出的文件压缩格式？处理步骤当前Hive支持以下几种压缩格式： org.apache.hadoop.io.compress.BZip2Codec org.apache.hadoop.io.compress

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
如何对Hive表大小数据进行监控 - MapReduce服务 MRS

如何对Hive表大小数据进行监控问题如何对Hive中的表大小数据进行监控？回答当用户要对Hive表大小数据进行监控时，可以通过HDFS的精细化监控对指定表目录进行监控，从而到达监控指定表大小数据的目的。前提条件 Hive、HDFS组件功能正常 HDFS精细化监控功能正常

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
创建HDFS文件并写入内容 - 开发HDFS应用 - MapReduce服务 MRS

创建HDFS文件并写入内容功能简介写文件过程为：使用FileSystem实例的create方法获取写文件的输出流。使用该数据流将内容写入到HDFS的指定文件中。在写完文件后，需关闭所申请资源。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
Spark从Hive读取数据再写入HBase样例程序（Python） - Spark从Hive读取数据再写入HBase样例程序 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
Spark从Hive读取数据再写入HBase样例程序（Python） - Spark从Hive读取数据再写入HBase样例程序 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
使用Hash shuffle出现任务失败 - Spark Core - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - Spark Core - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Hive on Hue - MapReduce服务 MRS
Hive on Hue - MapReduce服务 MRS

Hive on Hue Hue提供了Hive图形化管理功能，使用户可以通过界面的方式查询Hive的不同数据。查询编辑器使用介绍访问Hue WebUI，请参考访问Hue WebUI界面。在左侧导航栏单击编辑器，然后选择“Hive”，进入“Hive”。执行Hive HQL语句

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
如何处理blob.storage.directory配置/home目录时启动yarn-session失败 - MapReduce服务 MRS

如何处理blob.storage.directory配置/home目录时启动yarn-session失败问题当用户设置“blob.storage.directory”为“/home”时，用户没有权限在“/home”下创建“blobStore-UUID”的文件，导致yarn-session启动失败。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题
Flink对接云搜索服务（CSS）样例程序开发思路 - MapReduce服务 MRS

Flink对接云搜索服务（CSS）样例程序开发思路场景说明本样例实现了Flink消费一个自定义数据源，并将消费的数据写入Elasticsearch或云搜索服务CSS的功能。主要提供了Elasticsearch Sink的构建及参数设置方法，实现通过Flink将数据写入Elasticsearch的功能。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink对接云搜索服务（CSS）样例程序
二进制函数和运算符 - MapReduce服务 MRS

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Impala应用开发常用概念 - MapReduce服务 MRS

Impala应用开发常用概念客户端客户端直接面向用户，可通过Java API、Thrift API访问服务端进行Impala的相关操作。本文中的Impala客户端特指Impala client的安装目录，里面包含通过Java API访问Impala的样例代码。 HiveQL语言

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > Impala应用开发概述

总条数： 5577

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消