Flink-没有用于方案的文件系统：hdfs

Question

Flink-没有用于方案的文件系统：hdfs

Mr.*_*. M 5 hadoop hdfs avro apache-flink

我当前正在开发一个Flink 1.4应用程序，该程序从Hadoop群集中读取Avro文件。但是，在我的IDE上以本地模式运行它可以很好地工作。但是，当我将其提交给Jobmanager Flink时，它总是失败，并显示以下消息：

java.io.IOException: Error opening the Input Split hdfs://namenode/topics/CaseLocations/partition=0/CaseLocations+0+0000155791+0000255790.avro [0,16549587]: Could not find a file system implementation for scheme 'hdfs'. The scheme is not directly supported by Flink and no Hadoop file system to support this scheme could be loaded.
at org.apache.flink.api.common.io.FileInputFormat.open(FileInputFormat.java:705)
at org.apache.flink.formats.avro.AvroInputFormat.open(AvroInputFormat.java:110)
at org.apache.flink.formats.avro.AvroInputFormat.open(AvroInputFormat.java:54)
at org.apache.flink.runtime.operators.DataSourceTask.invoke(DataSourceTask.java:145)
at org.apache.flink.runtime.taskmanager.Task.run(Task.java:718)
at java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.flink.core.fs.UnsupportedFileSystemSchemeException: Could not find a file system implementation for scheme 'hdfs'. The scheme is not directly supported by Flink and no Hadoop file system to support this scheme could be loaded.
at org.apache.flink.core.fs.FileSystem.getUnguardedFileSystem(FileSystem.java:405)
at org.apache.flink.core.fs.FileSystem.get(FileSystem.java:320)
at org.apache.flink.api.common.io.FileInputFormat$InputSplitOpenThread.run(FileInputFormat.java:864)
Caused by: org.apache.flink.core.fs.UnsupportedFileSystemSchemeException: Hadoop File System abstraction does not support scheme 'hdfs'. Either no file system implementation exists for that scheme, or the relevant classes are missing from the classpath.
at org.apache.flink.runtime.fs.hdfs.HadoopFsFactory.create(HadoopFsFactory.java:102)
at org.apache.flink.core.fs.FileSystem.getUnguardedFileSystem(FileSystem.java:401)
... 2 more
Caused by: java.io.IOException: No FileSystem for scheme: hdfs
at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2798)
at org.apache.flink.runtime.fs.hdfs.HadoopFsFactory.create(HadoopFsFactory.java:99)
... 3 more

Run Code Online (Sandbox Code Playgroud)

我正在使用官方Flink Docker映像运行群集，该映像flink:1.4.0-hadoop28-scala_2.11应该已经包含Hadoop发行版。

我也尝试将依赖项添加到我的应用程序jar中，但这也没有帮助。这是我的sbt依赖项：

val flinkVersion = "1.4.0"
val hadoopVersion = "2.8.1"
val providedDependencies = Seq(
    "org.apache.flink" %% "flink-clients" % flinkVersion,
    "org.apache.flink" %% "flink-scala" % flinkVersion,
    "org.apache.flink" %% "flink-streaming-scala" % flinkVersion
)
val compiledDependencies = Seq(
    "org.apache.flink" % "flink-hadoop-fs" % flinkVersion,
    "org.apache.hadoop" % "hadoop-hdfs" % hadoopVersion,
    "org.apache.hadoop" % "hadoop-common" % hadoopVersion,
    "org.apache.flink" % "flink-avro" % flinkVersion,
    "org.apache.flink" %% "flink-table" % flinkVersion,
    "org.scalaj" %% "scalaj-http" % "2.2.1"
)

Run Code Online (Sandbox Code Playgroud)

另外，文件系统类也包含在my中META-INF/services/org.apache.hadoop.fs.FileSystem。

我想念什么吗？官方文档帮不了我。

提前致谢

Answer 1

小智 3

首先，您需要一个 HDFS 集群。

其次，您需要检查 FLINK_HOME/lib 下是否有 flink-shaded-hadoop-2-uber-xxx.xx.jar。

如果您计划将 Apache Flink 与 Apache Hadoop 一起使用（在 YARN 上运行 Flink、连接到 HDFS、连接到 HBase 或使用某些基于 Hadoop 的文件系统连接器），则选择捆绑匹配 Hadoop 版本的下载，下载可选的预安装包- 捆绑与您的版本匹配的 Hadoop 并将其放置在 Flink 的 lib 文件夹中，或者导出您的 HADOOP_CLASSPATH。

归档时间：	8 年前
查看次数：	2034 次
最近记录：	6 年，8 月前