我有一个 Avro 二进制格式的字符串。我想将字符串转换为 json。有人可以指导我吗?我尝试使用在线提供的解决方案它没有用。
public String avroToJson(byte[] avro) throws IOException {
boolean pretty = false;
GenericDatumReader<GenericRecord> reader = null;
JsonEncoder encoder = null;
ByteArrayOutputStream output = null;
try {
reader = new GenericDatumReader<GenericRecord>();
InputStream input = new ByteArrayInputStream(avro);
DataFileStream<GenericRecord> streamReader = new DataFileStream<GenericRecord>(input, reader);
output = new ByteArrayOutputStream();
Schema schema = streamReader.getSchema();
DatumWriter<GenericRecord> writer = new GenericDatumWriter<GenericRecord>(schema);
encoder = EncoderFactory.get().jsonEncoder(schema, output, pretty);
for (GenericRecord datum : streamReader) {
writer.write(datum, encoder);
}
encoder.flush();
output.flush();
return new String(output.toByteArray());
} finally {
try {
if (output != null) output.close();
} catch (Exception e) {
}
}
}
Run Code Online (Sandbox Code Playgroud)
我正在使用 getBytes() 将我的字符串转换为字节数组并将其传递给此函数。我收到此异常。线程“main” org.apache.avro.InvalidAvroMagicException 中的异常:不是 Avro 数据文件。
Avro 指定了一种用于序列化一个对象的二进制格式,但也指定了一个对象容器文件(也称为数据文件),它可以以一种有用的方式保存许多对象以进行文件访问。
DataFileStream 需要容器文件,但从您的描述来看,您似乎只有一个序列化实例。
你可能想要这样的东西:
public String avroToJson(Schema schema, byte[] avroBinary) throws IOException {
// byte to datum
DatumReader<Object> datumReader = new GenericDatumReader<>(schema);
Decoder decoder = DecoderFactory.get().binaryDecoder(avroBinary, null);
Object avroDatum = datumReader.read(null, decoder);
// datum to json
String json = null;
try (ByteArrayOutputStream baos = new ByteArrayOutputStream()) {
DatumWriter<Object> writer = new GenericDatumWriter<>(schema);
JsonEncoder encoder = EncoderFactory.get().jsonEncoder(schema, baos, false);
writer.write(avroDatum, encoder);
encoder.flush();
baos.flush();
return new String(baos.toByteArray(), StandardCharsets.UTF_8);
}
}
Run Code Online (Sandbox Code Playgroud)
请注意,这意味着您必须提前知道架构才能反序列化二进制数据。如果它是Avro 数据文件,您可以从文件元数据中获取架构。
| 归档时间: |
|
| 查看次数: |
6212 次 |
| 最近记录: |