两个整数的XOR可以超出界限吗？

Question

我一直在研究在数组中查找孤独整数的算法,这里是实现:

int arr[] = {10, 20, 30, 5, 20, 10, 30};
int LonelyInteger = 0;
for(int i=0; i< 7; i++)
{
    LonelyInteger = LonelyInteger ^ arr[i];
}

结果是5.

我的问题是 - 据说整数(由XOR操作产生)由于这个操作太大了:

LonelyInteger ^ arr[i]

这导致一个潜在的大整数,int在这种情况下无法用数据类型表示.我的问题是:

Answer 1

XOR 永远不会超出界限,因为它结合了位并且不创建之前没有设置位的新位.

结果5是正确的.查看您的值和XOR结果的二进制表示

10    00001010
20    00010100
30    00011110
 5    00000101
20    00010100
10    00001010
30    00011110
--------------
      00000101 => 5

计算许多XORed值的结果的一个简单帮助是:结果将有一个位设置,其中奇数位组合,没有位设置偶数位.

如果不可能发生这种情况,那么有证据吗？

XOR相当于不加个别位的加法.在没有进位的情况下添加位时,不会发生溢出,因此该int值不会超出范围.

Answer 2

int由于操作被定义为组合其操作数的位值而不产生任何新位,因此在其表示需要比提供的位更多的位的意义上,结果永远不会"太大" .也许一个更好的问题可能是,结果是否可以是除了有效值表示之外的其他东西int？

对于无符号整数,没有.所有位模式以及因此所有按位操作的结果都是有效的值表示.

对于有符号整数,它取决于实现定义的负值表示.您可能遇到的每个实现都使用2的补码,其中每个位模式都是有效的; 所以,任何按位运算的结果都是有效的表示.

但是,该标准还允许其他表示,其中可能存在一个或多个无效位模式.在这种情况下,有两个有效操作数的按位运算可能产生该模式,从而产生无效结果.

Answer 3

(这篇文章适用于C,而不是C++)

由于设置了无效的填充位,位运算符不能导致陷阱表示,参见C11 6.2.6.2/1脚注:

...对有效值没有算术运算可以生成陷阱表示...

("算术运算"的含义不清楚,但索引链接到6.5.11,这是XOR的定义).

但是,在C中,它们会导致产生负零.在2的补码中没有负零.但是假设您使用的是1的补码系统,那么您可以生成负零通过^,这可能会导致陷阱表示.6.2.6.2/3明确表示这是可能的:

如果实现支持负零,则只能通过以下方式生成它们:

- &,|,^,〜,<<和>>运算符,其操作数产生这样的值;

最后6.2.6.2/2暗示(我很确定无论如何),不可能有任何值位组合表示超过整数 INT_MAX

总而言之,^两个方面int的可能结果是:

@mafso:我相信一些二进制补码实现定义INT_MIN是-32767,以避免任何义务来处理一些极端情况的东西如printf,师等.例如,一台机器只有一个签署右移上当n为负时,n/4的运算可以计算 - ( - n)>> 2.如果n = -32767,这将产生-8191,但如果n = -32768它会产生8192如果是INT_MIN -32767,的(-32768)/ 4计算将是未定义行为,所以具有它得到8192将是完全合法. (2认同)
@mafso:另外,虽然我不知道任何将-INT_MAX-1视为陷阱或NaN的硬件,但肯定有时候NaN会有用(如果溢出发生在计算中的任何阶段都可能比必须在每个阶段检查和捕获溢出更有效,特别是在支持无序执行的系统上.我不确定这些硬件是否可以解决鸡蛋问题,但我不介意有这样的东西可用. (2认同)