mmu*_*hid 1 java string encode utf-8
我需要将String内容解析为二进制序列,并将它们转换为UTF-8等效String.
例如,B,A和R的UTF-8二进制当量如下:B = 01000010 A = 01000001 R = 01010010
现在,我需要将字符串"010000100100000101010010"转换为字符串"BAR",
即对于上述情况,输入24个字符的字符串被分成三个相等的部分(每个部分中有8个字符)并转换为其UTF-8等价物作为字符串值.
示例代码:
public static void main(String args[]) {
String B = "01000010";
String A = "01000001";
String R = "01010010";
String BAR = "010000100100000101010010";
String utfEquiv = toUTF8(BAR);//expecting to get "BAR"
System.out.println(utfEquiv);
}
private static String toUTF8(String str) {
// TODO
return "";
}
Run Code Online (Sandbox Code Playgroud)
什么应该是方法toUTF8(String str){}的实现
你应该把它分成两个问题:
后者非常简单,使用new String(bytes, StandardCharsets.UTF_8).
对于第一部分,棘手的部分是Byte.parseByte不会自动处理前导1 ...所以我可能会将每个8位字符串解析为a short然后转换为byte:
public static byte[] binaryToBytes(String input) {
// TODO: Argument validation (nullity, length)
byte[] ret = new byte[input.length() / 8];
for (int i = 0; i < ret.length; i++) {
String chunk = input.substring(i * 8, i * 8 + 8);
ret[i] = (byte) Short.parseShort(chunk, 2);
}
return ret;
}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1473 次 |
| 最近记录: |