ski*_*esh 2 apache-spark spark-structured-streaming
我需要通过 Spark Streaming 读取 CSV 文件,并将输出流写入具有特定行/大小块的控制台。
使用 Spark StreamingreadStream读取 CSV 并将writeStream其写入控制台。
val df: DataFrame = sparkSession.readStream
.option("sep", ",")
.schema(userSchema)
.csv("path")
val res: StreamingQuery = df.writeStream
.format("console")
.start()
Run Code Online (Sandbox Code Playgroud)
我希望所有 50000 行以 50 行为一组显示在控制台中,但我只得到 20 行,或者我需要设置一个要在控制台中显示的数字。
您可以通过在 writestream 上设置“ numRows ”属性来设置要显示的行数。
df.writeStream
.option("numRows",50)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2640 次 |
| 最近记录: |