我正在流式传输R mapreduce作业,我需要获取文件名.我知道Hadoop在启动之前为当前作业设置环境变量,我可以使用Sys.getenv()访问R中的env变量.
我发现: 在流式传输hadoop程序中获取输入文件名
和Sys.getenv(mapred_job_id)工作正常,但它不是我需要的.我只需要文件名而不是作业ID或名称.我还发现:如何在EC2上运行mapreduce作业时获取文件名?
但这也没有用.从R流式传输时获取当前文件名的最简单方法是什么?谢谢
filenames hadoop r environment-variables hadoop-streaming
environment-variables ×1
filenames ×1
hadoop ×1
hadoop-streaming ×1
r ×1