将int存储在C中的char缓冲区中,然后检索它

Question

将int存储在C中的char缓冲区中,然后检索它

Pra*_*tik 9 c bit-manipulation bit-shift

我正在编写一个套接字客户端 - 服务器应用程序,其中服务器需要向客户端发送一个大缓冲区,并且所有缓冲区都应该单独处理,所以我想将缓冲区长度放在缓冲区中,以便客户端可以读取数据长度从缓冲区和相应的过程.

要设置长度值,我需要将每个字节中的整数值除以一个字节,并将其存储在缓冲区中以通过套接字发送.我能够将整数分成四个部分,但在加入时我无法检索到正确的值.为了演示我的问题,我编写了一个示例程序,我将int分成四个char变量,然后将它连接回另一个整数.目标是加入后我应该得到相同的结果.

这是我的小程序.

#include <stdio.h>

int main ()
{
    int inVal = 0, outVal =0;
    char buf[5] = {0};

    inVal = 67502978;

    printf ("inVal: %d\n", inVal);

    buf[0] = inVal & 0xff;
    buf[1] = (inVal >> 8) & 0xff;
    buf[2] = (inVal >> 16) & 0xff;
    buf[3] = (inVal >> 24) & 0xff;

    outVal = buf[3];
    outVal = outVal << 8;
    outVal |= buf[2];
    outVal = outVal << 8;
    outVal |= buf[1];
    outVal = outVal << 8;
    outVal |= buf[0];

    printf ("outVal: %d\n",outVal);
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

产量

inVal:67502978 outVal:-126

我究竟做错了什么？

Answer 1

Lun*_*din 19

一个问题是您在签名号码上使用逐位运算符.这总是一个坏主意,几乎总是不正确的.请注意,char具有实现定义的签名,与int此不同,签名始终是签名的.

因此,你应该更换int使用uint32_t和char用uint8_t.使用这种无符号类型可以消除在负数上使用位移的可能性,这可能是一个错误.同样,如果将数据移入带符号数的符号位,则会出现错误.

不用说,如果整数不是4字节大,代码将不起作用.

Answer 2

chq*_*lie 11

您的方法具有潜在的实现定义行为以及未定义的行为:

存储值代入式的阵列char以外类型的范围char已经实现定义行为:buf[0] = inVal & 0xff;与下一个3个语句(inVal & 0xff可能大于CHAR_MAX如果char类型默认签名).
左移负值调用未定义的行为:如果数组中的3个第一个字节中的任何一个变为负数,因为实现定义的结果是存储大于CHAR_MAX它的值,则结果outVal变为负数,左移它是未定义的.

在您的特定示例中,您的体系结构使用2的补码表示来表示负值,并且类型char已签名.存储的值buf[0]是67502978 & 0xff = 130,变为-126.最后一个语句outVal |= buf[0];设置第7到31位outVal,结果是-126.

您可以通过使用类型的数组unsigned char和值来避免这些问题unsigned int:

#include <stdio.h>

int main(void) {
    unsigned int inVal = 0, outVal = 0;
    unsigned char buf[4] = { 0 };

    inVal = 67502978;

    printf("inVal: %u\n", inVal);

    buf[0] = inVal & 0xff;
    buf[1] = (inVal >> 8) & 0xff;
    buf[2] = (inVal >> 16) & 0xff;
    buf[3] = (inVal >> 24) & 0xff;

    outVal = buf[3];
    outVal <<= 8;
    outVal |= buf[2];
    outVal <<= 8;
    outVal |= buf[1];
    outVal <<= 8;
    outVal |= buf[0];

    printf("outVal: %u\n", outVal);
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

请注意,上面的代码仍假定为32位整数.

Answer 3

Pet*_*ica 6

虽然有符号值的位移可能是个问题,但这不是这种情况(所有左手值都是正数,并且所有结果都在32位无符号整数范围内).

有些不直观的语义的有问题的表达式是最后的按位OR:

outVal |= buf[0];

Run Code Online (Sandbox Code Playgroud)

buf[0]是(在你和我的架构上)签名的char值为-126,只是因为67502978的最低有效字节中的最高位被设置.在C中,算术表达式中的所有操作数都受算术转换的影响.具体来说,它们经历整数提升,声明:"如果int可以表示原始类型的所有值[...],则该值将转换为int".因此,签名字符buf[0]转换为(带符号)int,保留其值-126.负的signed int具有符号位设置.与另一个signed int进行ORing也会设置结果的符号位,使该值为负值.这正是我们所看到的.

使字节unsigned chars修复了问题,因为转换unsigned char的临时整数的值是一个简单的8位值130.

Answer 4

Ste*_*ner 4

使用unsigned char buf[5] = {0};andunsigned int来代替inValand outVal，它应该可以工作。

当使用有符号整数类型时，会出现两类问题：

首先，如果buf[3]为负数，则由于outVal = buf[3]变量outVal变为负数；随后的位移运算符是cppreference.com 关于位移运算符的outVal未定义行为：

对于有符号且正的 a，如果 a << b 的值可表示返回类型，则其值为 a * 2b，否则行为未定义。（直到 C++14），如果 a << b 的值可以用返回类型的无符号版本表示（然后转换为有符号），则它的值是 a * 2b：这使得将 INT_MIN 创建为 1<< 是合法的31)，否则行为未定义。（自 C++14 起）

对于负 a，a << b 的行为是未定义的。

请注意，对于 OP，inVal = 67502978这种情况不会发生，因为buf[3]=4; 但对于其他inVal情况，它可能会发生，然后可能会由于“未定义的行为”而带来问题。

第二个问题是，使用操作时outVal |= buf[0]，在应用运算符之前，二进制格式为的buf[0]=-126值会转换为，二进制格式为，然后这将填充很多- 位。转换的原因在算术运算的转换规则 (cppreference.com)中定义：(char)-12610000010(int)-12611111111111111111111111110000010|=outVal1

如果两个操作数都是有符号的或都是无符号的，则具有较小转换等级的操作数将转换为具有较大整数转换等级的操作数

所以OP案例中的问题实际上不是因为任何未定义的行为，而是因为字符buf[3]是负值，在操作int之前被转换为负值|=。

但请注意，如果或buf[2]为buf[1]负数，则这将变为outVal负数，并且也会导致后续移位操作中出现未定义的行为。

这不是整数溢出，而是对符号位的直接操作。根据 C11 6.5.7/4，这是未定义的行为：“E1 << E2 的结果是 E1 左移 E2 位位置；” //“如果 E1 具有带符号类型和非负值，并且 E1 × 2E2 可在结果类型中表示，则这就是结果值；否则，行为未定义。” (2认同)

归档时间：	8 年，10 月前
查看次数：	2880 次
最近记录：	8 年，10 月前