将 Avro 二进制字符串转换为 Json

Anu*_*rve 2 java avro

我有一个 Avro 二进制格式的字符串。我想将字符串转换为 json。有人可以指导我吗?我尝试使用在线提供的解决方案它没有用。

public String avroToJson(byte[] avro) throws IOException {
        boolean pretty = false;
        GenericDatumReader<GenericRecord> reader = null;
        JsonEncoder encoder = null;
        ByteArrayOutputStream output = null;
        try {
            reader = new GenericDatumReader<GenericRecord>();
            InputStream input = new ByteArrayInputStream(avro);
            DataFileStream<GenericRecord> streamReader = new DataFileStream<GenericRecord>(input, reader);
            output = new ByteArrayOutputStream();
            Schema schema = streamReader.getSchema();
            DatumWriter<GenericRecord> writer = new GenericDatumWriter<GenericRecord>(schema);
            encoder = EncoderFactory.get().jsonEncoder(schema, output, pretty);
            for (GenericRecord datum : streamReader) {
                writer.write(datum, encoder);
            }
            encoder.flush();
            output.flush();
            return new String(output.toByteArray());
        } finally {
            try {
                if (output != null) output.close();
            } catch (Exception e) {
            }
        }
    }
Run Code Online (Sandbox Code Playgroud)

我正在使用 getBytes() 将我的字符串转换为字节数组并将其传递给此函数。我收到此异常。线程“main” org.apache.avro.InvalidAvroMagicException 中的异常:不是 Avro 数据文件。

Rya*_*aba 5

Avro 指定了一种用于序列化一个对象的二进制格式,但也指定了一个对象容器文件(也称为数据文件),它可以以一种有用的方式保存许多对象以进行文件访问。

DataFileStream 需要容器文件,但从您的描述来看,您似乎只有一个序列化实例。

你可能想要这样的东西:

  public String avroToJson(Schema schema, byte[] avroBinary) throws IOException {
    // byte to datum
    DatumReader<Object> datumReader = new GenericDatumReader<>(schema);
    Decoder decoder = DecoderFactory.get().binaryDecoder(avroBinary, null);
    Object avroDatum = datumReader.read(null, decoder);

    // datum to json
    String json = null;
    try (ByteArrayOutputStream baos = new ByteArrayOutputStream()) {
      DatumWriter<Object> writer = new GenericDatumWriter<>(schema);
      JsonEncoder encoder = EncoderFactory.get().jsonEncoder(schema, baos, false);
      writer.write(avroDatum, encoder);
      encoder.flush();
      baos.flush();
      return new String(baos.toByteArray(), StandardCharsets.UTF_8);
    }
  }
Run Code Online (Sandbox Code Playgroud)

请注意,这意味着您必须提前知道架构才能反序列化二进制数据。如果它Avro 数据文件,您可以从文件元数据中获取架构。