我的序列化机制有什么问题?

yeg*_*256 1 java

这是在Mac OS(JDK 1.6)上正常运行的代码:

String s1 = "test";
ByteArrayInputStream in = new ByteArrayInputStream(s.getBytes());
String s2 = (String)(new ObjectInputStream(in).readObject());
Run Code Online (Sandbox Code Playgroud)

在Linux CentOS 5.4 Java上说:

java.io.StreamCorruptedException: invalid stream header: 3F3F0005
at java.io.ObjectInputStream.readStreamHeader(ObjectInputStream.java:783)
at java.io.ObjectInputStream.<init>(ObjectInputStream.java:280)
at com.XXX.SerializableTest.testWorks(SerializableTest.java:26)
[...]
Run Code Online (Sandbox Code Playgroud)

这是什么意思?

eri*_*son 12

ObjectInputStream仅适用于写入的数据ObjectOutputStream.

getBytes()方法String不是Java Serialization机制; 它只是使用您平台的默认字符编码对字符串进行编码.


getBytes()对于大多数应用程序,使用无参数方法是一个坏主意.正如我所说,它使用它运行的平台的默认编码.如果结果将在不同的机器上使用,则可能会中断.

对于大多数应用程序,您应该明确指定要使用的字符编码.

重要的是要记住某些字节编码在某些字符编码中无效.如果要将任意字节序列转换为字符串,请选择一个为每个字节值分配单个字符的编码(如果有这样的东西;我熟悉的常见字符不使用每个字节) .

我猜测,而不是"test",有问题的字符串是这样创建的:

ByteArrayOutputStream buf = ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(buf);
oos.writeObject(x);
oos.flush();
oos.close();
/* BAD! you should specify encoding! */
String encoded = new String(buf.toByteArray()); 
Run Code Online (Sandbox Code Playgroud)

相反,最后一行应该如下所示,其中encoding是一个合适的字符编码,如上所述:

String encoded = new String(buf.toByteArray(), encoding);
Run Code Online (Sandbox Code Playgroud)

然而,更好的技术是使用专门设计用于将"二进制"数据表示为文本的编码.Base-64得到广泛支持.Base-85更紧凑,但不是那么普遍.您需要第三方库来执行这些编码之一.(Base-64在Sun [Oracle]运行时实现,但它不是公共API的一部分.)