微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

waterdrop使用cdh的spark2提交任务

有的公司使用的是cdh集群,用waterdrop同步数据的时候会遇到spark版本太低,需要切换到spark2去。
特此记录一下切换过程以及遇到的问题。

  1. 更改waterdrop的bin目录下的start-waterdrop.sh文件,更改spark-submit为spark2-submit

    在这里插入图片描述

  2. 更改waterdrop的config目录下的waterdrop-env.sh文件,更改SPARK_HOME的配置。

    在这里插入图片描述

    如果环境变量中配置了SPARK_HOME,首先检查环境变量中的SPARK_HOME

问题:

  1. Exception in thread “main” java.lang.NoSuchFieldError: INSTANCE
    原因是CDH版本Spark自带的 httpclient.jar 版本较低,而ClickHouse JDBC基于的httpclient版本为4.5.2,包版本冲突。解决方法是用 httpclient-4.5.2 版本替换掉 CDH 自带jar包
    我放的路径(路径不统一,根据自己搭建的路径改,不清楚的可以查看spark任务日志中加载的路径):

    在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐