CDH6.3.0 hive计算引擎由mr改为spark

CDH6.3.0 hive计算引擎由mr改为spark

iteen

1579人浏览 · 2022-05-25 13:50:27

iteen · 2022-05-25 13:50:27 发布

Hive默认使用的计算框架是MapReduce，在我们使用Hive的时候通过写SQL语句，Hive会自动将SQL语句转化成MapReduce作业去执行，但是MapReduce的执行速度远差于Spark。通过搭建一个Hive On Spark可以修改Hive底层的计算引擎，将MapReduce替换成Spark，从而大幅度提升计算速度。

1.在CDH集群中添加hive和spark组件

2.修改hive配置

添加完组件后再hive会报警告,将此处修改为spark

然后再修改hive的执行引擎为spark

然后更新配置,重启相关服务就可以了.

重启完服务后,在有hive组件的节点查看hive的配置文件(hive-site.xml)可查看已经修改成功

永洪数据分析社区

永洪科技，致力于打造全球领先的数据技术厂商，具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐

cover

Python 数据分析与可视化：开启数据洞察之旅（5/10）

永洪数据分析社区

高级可视化图表分析实践——以《大侠立志传》武器系统为例

高级可视化图表分析实践——以《大侠立志传》武器系统为例

永洪数据分析社区

Dify+数据库+ECharts打造数据可视化图表，让数据自己说话！

今天分享一下如何利用Dify平台，结合强大的Echarts图表库，轻松搭建工作流。将数据库中的数据直接转化为精美的可视化图表，让数据开口说话。

永洪数据分析社区

所有评论(0)

查看更多评论

iteen

已为社区贡献1条内容