我试图使用文件中的Apache spark过滤掉特定文件的日期到RDD功能sc.textFile().
我试图做以下事情:
sc.textFile("/user/Orders/201507(2[7-9]{1}|3[0-1]{1})*")
Run Code Online (Sandbox Code Playgroud)
这应符合以下要求:
/user/Orders/201507270010033.gz
/user/Orders/201507300060052.gz
Run Code Online (Sandbox Code Playgroud)
知道怎么做到这一点?