由于不推荐使用getLocalCacheFiles(),我正在尝试寻找替代方案.getCacheFiles()似乎是一个,但我怀疑它们是否相同.
当您调用addCacheFile()时,HDFS中的文件将下载到每个节点,使用getLocalCacheFiles()您可以获取本地化文件路径,您可以从本地文件系统中读取它.但是,getCacheFiles()返回的是HDFS中文件的URI.如果您通过此URI读取文件,我怀疑您仍然从HDFS而不是本地文件系统读取.
以上是我的理解,我不知道是否正确.如果是这样,有什么替代方案getLocalCacheFiles()?为什么Hadoop首先弃用它?