似乎没有任何方法可以将数据附加到现有的Avro序列化文件中。我想有多个进程写入单个avro文件,但是每次打开文件时,我似乎都是从头开始。我不想读所有数据,然后再次写回。
使用红宝石示例代码,我尝试将“ ab”和“ ab +”设置为各种设置,但没有任何乐趣。
file = File.open('data.avr', 'wb')
schema = Avro::Schema.parse(SCHEMA)
writer = Avro::IO::DatumWriter.new(schema)
dw = Avro::DataFile::Writer.new(file, writer, schema)
dw << {"username" => "john", "age" => 25, "verified" => true}
dw << {"username" => "ryan", "age" => 23, "verified" => false}
dw.close
Run Code Online (Sandbox Code Playgroud) avro ×1