将字节数组解码为字符串而不会丢失数据

Kum*_*rma 2 java arrays string encode decode

我试图将byte []转换为字符串,如下所示:

Map<String, String> biomap = new HashMap<String, String>();
biomap.put("L1", new String(Lf1, "ISO-8859-1"));
Run Code Online (Sandbox Code Playgroud)

其中Lf1是byte []数组然后我将此字符串转换为byte []:问题是,当我将字节数组转换为字符串时,它就像:

FMR  F P?d@? ?0d@r (@? ......... etc
Run Code Online (Sandbox Code Playgroud)

String SF1 = biomap.get("L1");
byte[] storedL1 = SF1.getBytes("ISO-8859-1")
Run Code Online (Sandbox Code Playgroud)

当我将它转换回字节数组并比较两个数组时,它返回false.我的意思是Data Changed.

我想要与我编码为字符串和解码到byte []时相同的byte []数据

Rom*_*kiy 7

第一:如果使用此编码将任意字节数组转换为字符串,ISO-8859-1不会导致任何数据丢失.考虑以下程序:

public class BytesToString {
    public static void main(String[] args) throws Exception {
        // array that will contain all the possible byte values
        byte[] bytes = new byte[256];
        for (int i = 0; i < 256; i++) {
            bytes[i] = (byte) (i + Byte.MIN_VALUE);
        }

        // converting to string and back to bytes
        String str = new String(bytes, "ISO-8859-1");
        byte[] newBytes = str.getBytes("ISO-8859-1");

        if (newBytes.length != 256) {
            throw new IllegalStateException("Wrong length");
        }
        boolean mismatchFound = false;
        for (int i = 0; i < 256; i++) {
            if (newBytes[i] != bytes[i]) {
                System.out.println("Mismatch: " + bytes[i] + "->" + newBytes[i]);
                mismatchFound = true;
            }
        }
        System.out.println("Whether a mismatch was found: " + mismatchFound);
    }
}
Run Code Online (Sandbox Code Playgroud)

它构建一个包含所有可能字节值的字节数组,然后将其转换为String使用ISO-8859-1,然后使用相同的编码返回字节.

这个程序输出Whether a mismatch was found: false,所以bytes-> String-> bytes转换通过ISO-8859-1产生与开头相同的数据.

但是,正如评论中指出的那样,String二进制数据不是一个好的容器.具体来说,这样的字符串几乎肯定会包含不可打印的字符,因此如果您打印它或尝试通过HTML或其他方式传递它,您将遇到一些问题(例如数据丢失).

如果您确实需要将字节数组转换为字符串(并使用opaquely),请使用base64编码:

String stringRepresentation = Base64.getEncoder().encodeToString(bytes);
byte[] decodedBytes = Base64.getDecoder().decode(stringRepresentation);
Run Code Online (Sandbox Code Playgroud)

它需要更多空间,但结果字符串在打印方面是安全的.