如何安全地使用 Java 字节作为无符号字符?

Con*_*nce 5 c java unsigned bit-manipulation

我正在将一些使用大量位操作的 C 代码移植到 Java 中。C 代码在假设 int 为 32 位宽且 char 为 8 位宽的假设下运行。其中有断言检查这些假设是否有效。

我已经来的事实而言,我将不得不使用long代替unsigned int。但是我可以安全地byte用作替代品unsigned char吗?

它们仅代表字节,但我已经遇到了这个奇怪的事件:(在 C 中data是一个unsigned char *byte[]在 Java 中是一个):

/* C */
uInt32 c = (data[0] << 24) | (data[1] << 16) | (data[2] << 8) | data[3];

/* Java */
long a = ((data[0] << 24) | (data[1] << 16) | (data[2] << 8) | data[3]) & 0xffffffff;
long b = ((data[0] & 0xff) << 24) | ((data[1] & 0xff) << 16) |
          ((data[2] & 0xff) << 8) | (data[3] & 0xff) & 0xffffffff;
Run Code Online (Sandbox Code Playgroud)

你会认为左移操作是安全的。但由于在Java中奇怪的一元促销规则,ab不会是相同的,如果一些字节的data是“阴性”(b给出正确的结果)。

我应该注意哪些其他“问题”?我真的不想在short这里使用。

use*_*751 5

byte如果在计算中使用 a 之前确保将其值与 255(或 0xFF)进行按位与运算,则可以安全地使用 a来表示 0 到 255 之间的值。这会将其提升为int,并确保提升的值介于 0 和 255 之间。

否则,int使用符号扩展,整数提升将导致-128 和 127 之间的值。-127 作为byte(十六进制 0x81)将变成 -127 作为int(十六进制 0xFFFFFF81)。

所以你可以这样做:

long a = (((data[0] & 255) << 24) | ((data[1] & 255) << 16) | ((data[2] & 255) << 8) | (data[3] & 255)) & 0xffffffff;
Run Code Online (Sandbox Code Playgroud)

请注意,& 255此处第一个是不必要的,因为后面的步骤无论如何都会屏蔽掉额外的位 ( & 0xffffffff)。但始终包含它可能是最简单的。