相关疑难解决方法(0)

必须使用writeStream.start()执行带有流源的查询;

我正试图在spark中读取来自kafka(版本10)的消息并尝试打印它.

     import spark.implicits._

         val spark = SparkSession
              .builder
              .appName("StructuredNetworkWordCount")
              .config("spark.master", "local")
              .getOrCreate()  

            val ds1 = spark.readStream.format("kafka")
              .option("kafka.bootstrap.servers", "localhost:9092")  
              .option("subscribe", "topicA")
              .load()

           ds1.collect.foreach(println)
           ds1.writeStream
           .format("console")
           .start()

           ds1.printSchema()
Run Code Online (Sandbox Code Playgroud)

获取错误线程"main"中的异常

org.apache.spark.sql.AnalysisException:必须使用writeStream.start();;执行带有流源的查询

scala spark-streaming apache-spark-sql

15
推荐指数
3
解决办法
2万
查看次数

标签 统计

apache-spark-sql ×1

scala ×1

spark-streaming ×1