搜索_华为云

ClickHouse简介 - MapReduce服务 MRS
ClickHouse简介 - MapReduce服务 MRS

ClickHouse简介 ClickHouse简介 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > ClickHouse应用开发简介
Hive JDBC访问样例程序 - MapReduce服务 MRS

Hive JDBC访问样例程序 Hive JDBC样例程序开发思路创建Hive表加载数据到Hive表中查询Hive表数据实现Hive进程访问多ZooKeeper 使用JDBC接口提交数据分析任务父主题：开发Hive应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 开发Hive应用
Impala应用开发简介 - MapReduce服务 MRS

Impala应用开发简介 Impala直接对存储在HDFS，HBase 或对象存储服务（OBS）中的Hadoop数据提供快速，交互式SQL查询。除了使用相同的统一存储平台之外，Impala还使用与Apache Hive相同的元数据，SQL语法（Hive SQL），ODBC驱动程序

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > Impala应用开发概述
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
IE 10&IE 11浏览器无法保存数据 - MapReduce服务 MRS

[jobgroup]。原因 IE 11浏览器的某些版本在接收到HTTP 307响应时，会将POST请求转化为GET请求，从而使得POST数据无法下发到服务端。解决建议使用Google Chrome浏览器。父主题： Loader常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > Loader常见问题
Oozie定时任务没有准时运行如何处理 - MapReduce服务 MRS

Oozie定时任务没有准时运行如何处理问题在Hue或者Oozie客户端设置执行Coordinator定时任务，但没有准时执行。回答设置任务时，需要使用UTC时间。例如在“job.properties”中配置“start=2016-12-20T09:00Z”。修改配置后重新启动定时任务即可。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > Oozie常见问题
HDFS上更新了oozie的share lib目录但没有生效 - MapReduce服务 MRS

HDFS上更新了oozie的share lib目录但没有生效问题在HDFS的“/user/oozie/share/lib”目录上传了新的jar包，但执行任务时仍然报找不到类的错误。回答在客户端执行如下命令刷新目录： oozie admin -oozie https://xxx

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > Oozie常见问题
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
为什么Driver进程不能退出 - MapReduce服务 MRS

为什么Driver进程不能退出问题运行Spark Streaming任务，然后使用yarn application -kill applicationID命令停止任务，为什么Driver进程不能退出？回答使用yarn application -kill applicati

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
配置Flume加密传输 - MapReduce服务 MRS

ume服务（Flume角色）的服务端和客户端参数，使其可以正常工作。本章节适用于MRS 3.x及之后版本。前提条件已成功安装集群及Flume服务。操作步骤分别生成Flume角色服务端和客户端的证书和信任列表。使用ECM远程以omm用户登录将要安装Flume服务端的节点

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume加密传输数据采集任务
配置Flume对接安全模式Kafka - MapReduce服务 MRS

useKeyTab=true keyTab="/opt/test/conf/user.keytab" principal="flume_hdfs@<系统域名>" useTicketCache=false storeKey=true debug=true; }; 其中keyTab和prin

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume企业级能力增强
DataNode的容量计算出错如何处理 - MapReduce服务 MRS

DataNode的容量计算出错如何处理问题当多个data.dir被配置在一个磁盘分区内，DataNode的容量计算将会出错。回答目前容量计算是基于磁盘的，类似于Linux里面的df命令。理想状态下，用户不会在同一个磁盘内配置多个data.dir，否则所有的数据都将写入一个磁盘，在性能上会有很大的影响。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS常见问题
为什么存储小文件过程中，缓存中的数据会丢失 - MapReduce服务 MRS

为什么存储小文件过程中，缓存中的数据会丢失问题在存储小文件过程中，系统断电，缓存中的数据丢失。回答由于断电，当写操作完成之后，缓存中的block不会立即被写入磁盘，如果要同步地将缓存的block写入磁盘，用户需要将“客户端安装路径/HDFS/hadoop/etc/hadoop/hdfs-site

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS常见问题
配置创建Hive内部表时不能指定Location - MapReduce服务 MRS

行建库、表脚本迁移、重建元数据操作时需要特别注意，防止错误。操作步骤进入Hive服务配置页面： MRS 3.x之前版本，单击集群名称，登录集群详情页面，选择“组件管理 > Hive > 服务配置”，单击“基础配置”下拉菜单，选择“全部配置”。若集群详情页面没有“组件管理”页

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置Hive任务的最大map数 - MapReduce服务 MRS

此功能适用于Hive。此功能用于从服务端限定Hive任务的最大map数，避免HiveSever服务过载而引发的性能问题。操作步骤进入Hive服务配置页面： MRS 3.x之前版本，单击集群名称，登录集群详情页面，选择“组件管理 > Hive > 服务配置”，单击“基础配置”下拉菜单，选择“全部配置”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强 > Hive负载均衡
ClickHouse Projection设计 - MapReduce服务 MRS

ClickHouse Projection设计 Projection仅在MRS 3.2.0及以上的版本集群中支持。 projection定义 CREATE TABLE test_projection_table( level String, type String

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse物化视图设计
DGC方式如何创建Flink Hive Sql作业 - MapReduce服务 MRS

DGC方式如何创建Flink Hive Sql作业问题现象使用DGC方式如何创建Flink Hive Sql作业。解决方法若通过DGC方式创建提交Flink Hive作业，以读Kafka写Hive作业为例，步骤如下：提前在Hive客户端中创建Hive表。例如： create

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink常见开发问题
Flink作业提交时报错端口范围不足 - MapReduce服务 MRS

any port in port range 32326-32390。解决方法 MRS集群上服务众多，如果不限制端口范围可能导致其他服务端口被占用而导致异常，因此MRS集群给每个服务分配的端口范围是固定的，Flink端口范围是[32326-32390]。当Flink作业单个t

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink常见开发问题

总条数： 6665

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消