您的位置：首页 > 博客中心 > 数据库 >

Spark JDBC入门测试

时间：2022-03-10 17:57

spark jdbc分支源码下载地址

　　

编译spark jdbc

　　 ./make-distribution.sh --hadoop 2.3.0-cdh5.0.0 --with-yarn --with-hive --tgz

环境搭建

　　参照spark环境搭建；

　　在$SPARK_HOME/conf下添加hive-site.xml的配置文件（指定元数据存放的mysql信息）；

　　拷贝mysql驱动包到$SPARK_HOME/lib下，并在spark-env.sh文件中指定mysql驱动包路径到SPARK_CLASSPATH中；

启动

　　启动thriftserver： $SPARK_HOME/sbin/start-thriftserver.sh &

　　启动beeline： $SPARK_HOME/bin/beeline -u jdbc:hive2://hadoop000:10000 -n spark -p hadoop

　　 -n指定thriftserver的用户名，-p指定thriftserver的密码

测试

　　在benline启动的命令行中进行测试，测试语句如同hive或者shark

测试发现的问题

　　1、UDF暂时无法采用add jar的方式添加：add jar /home/spark/lib/hiveudf.jar 这种方式暂时spark jdbc并不支持；

　　解决办法：先将udf的jar包路径配置到SPARK_CLASSPATH下；

待beeline启动后通过create temporary function is_msisdn as ‘com.aisainfo.ocdc.hive.udf.UDFIsMsisdn‘;创建udf函数并使用

2、加载HDFS数据到表中，暂时不支持overwrite

Spark JDBC入门测试,布布扣,bubuko.com

相关推荐

电脑软件

热门排行

今日推荐

梦象动态壁纸免费版

版本：v1.7.6

大小：10.22MB

日期：2024-09-27
风速清理手机版

版本：v1.5.4

大小：47.90MB

日期：2024-09-27
我的桌面壁纸完整版

版本：v1.0

大小：48.35MB

日期：2024-09-27
火萤视频壁纸正版

版本：v10.2.3

大小：48.75MB

日期：2024-09-27
全能清理钥匙正版

版本：v2.3.6

大小：32.59MB

日期：2024-09-27
alook浏览器完整版

版本：v1.25

大小：33.97MB

日期：2024-09-27

热门手游

战争Z僵尸射击免费版

版本：v1.0

大小：85.29MB

日期：2024-09-27
像素射击世界正版

版本：v1.0.3

大小：126.13MB

日期：2024-09-27
转弯弓箭官方版

版本：v0.9.7

大小：52.66MB

日期：2024-09-27
弓箭名人手机版

版本：v1.1

大小：34.95MB

日期：2024-09-27
正中靶心安卓版

版本：v1.0

大小：91.90MB

日期：2024-09-27
英魂之战官方版

版本：1.1.9.Nineyou_Live

大小：67.28MB

日期：2024-09-27