About allod

allod · ‎05-18-2017

Thanks for sharing the code of your solution. I've also found that just making HiveContext variable lazy works: val sparkConf = new SparkConf().setAppName("StreamHDFSdata") sparkConf.set("spark.dynamicAllocation.enabled","false") val ssc = new StreamingContext(sparkConf, Seconds(5)) ssc.checkpoint("/user/hdpuser/checkpoint") val sc = ssc.sparkContext val smDStream = ssc.textFileStream("/user/hdpuser/data") val smSplitted = smDStream.map( x => x.split(";") ).map( x => Row.fromSeq( x ) ) ... lazy val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) smSplitted.foreachRDD( rdd => { // use sqlContext here } )

Online	Offline
Last Visited	‎05-23-2017 05:12 AM

Member Since	‎05-18-2017 01:28 AM
Last Visited	‎05-23-2017 05:12 AM
Posts	1
Kudos received	1

Cloudera Community

Re: How to write data from dStream into permanent ...