我是Scala和HDFS的新手:
我只是想知道我能够从Scala代码读取本地文件但是如何从HDFS读取:
import scala.io.source
object ReadLine {
def main(args:Array[String]) {
if (args.length>0) {
for (line <- Source.fromLine(args(0)).getLine())
println(line)
}
}
Run Code Online (Sandbox Code Playgroud)
在论证中我已经过了hdfs://localhost:9000/usr/local/log_data/file1..但是它的给出FileNotFoundException错误我肯定错过了一些东西..任何人都可以帮助我吗?
我正在尝试使用 Apache NiFi 使用 QueryDatabase 处理器有什么方法可以限制记录,例如:“select * from table limit 100”
NiFi 中的任何其他处理器支持此操作吗?