相关疑难解决方法(0)

如何使用正则表达式在sc.textFile中包含/排除一些输入文件?

我试图使用文件中的Apache spark过滤掉特定文件的日期到RDD功能sc.textFile().

我试图做以下事情:

sc.textFile("/user/Orders/201507(2[7-9]{1}|3[0-1]{1})*")
Run Code Online (Sandbox Code Playgroud)

这应符合以下要求:

/user/Orders/201507270010033.gz
/user/Orders/201507300060052.gz
Run Code Online (Sandbox Code Playgroud)

知道怎么做到这一点?

scala apache-spark

20
推荐指数
1
解决办法
2万
查看次数

标签 统计

apache-spark ×1

scala ×1