如何从java中的avro文件中提取模式

mba*_*a12 17 java avro avro-tools

你如何首先提取架构,然后从java中的avro文件中提取数据?除了java之外,与问题相同.

我已经看到了如何从avsc文件而不是avro文件中获取模式的示例.任何方向都非常赞赏.

Schema schema = new Schema.Parser().parse(new File("/home/Hadoop/Avro/schema/emp.avsc"));
Run Code Online (Sandbox Code Playgroud)

Hel*_*ira 28

如果您想知道Avro文件的架构而不必生成相应的类或关心该文件属于哪个类,您可以使用GenericDatumReader:

DatumReader<GenericRecord> datumReader = new GenericDatumReader<>();
DataFileReader<GenericRecord> dataFileReader = new DataFileReader<>(new File("file.avro"), datumReader);
Schema schema = dataFileReader.getSchema();
System.out.println(schema);
Run Code Online (Sandbox Code Playgroud)

然后你可以读取文件中的数据:

GenericRecord record = null;
while (dataFileReader.hasNext()) {
    record = dataFileReader.next(record);
    System.out.println(record);
}
Run Code Online (Sandbox Code Playgroud)

  • 对于那些使用 C# Avro Apache 库的人,实用函数 `DataFileReader&lt;GenericRecord&gt;.OpenReader(filename);` 可用于实例化 `dataFileReader`。一旦实例化,dataFileReader 的使用就像在 Java 中一样。 (2认同)