编译器在编译时如何检测数字溢出?

Muh*_*mad 3 c++ compiler-theory

编译器将源代码作为字符串处理,所以在C++中,例如当它鼓励类似于unsigned char x = 150;它的类型限制的语句时unsigned char必须在0和之间的范围内255.

我的问题是,数字150仍然是字符串,编译器使用什么算法比较数字序列 - 150在这种情况下 - 与类型限制?

我为一个十进制,八进制,十六进制和小端二进制的类型'int'做了一个简单的算法,但我不认为编译器会这样做以检测数字溢出.

我制作的算法用C++编码:

typedef signed char int8;
typedef signed int  int32;

#define DEC  0
#define HEX  1
#define OCT  2
#define BIN  3

bool isOverflow(const char* value, int32 base)
{
    // left-most digit for maximum and minimum number
    static const char* max_numbers[4][2] =
    {
        //                 INT_MAX                           INT_MIN
        {                       "2147483647",                       "2147483648" }, // decimal
        {                         "7fffffff",                         "80000000" }, // hexadecimal
        {                      "17777777777",                      "20000000000" }, // octal
        { "01111111111111111111111111111111", "10000000000000000000000000000000" }  // binary
    };

    // size of strings in max_numbers array
    static const int32 number_sizes[] = { 10, 8, 11, 32 };

    // input string size
    int32 str_len = strlen(value);

    // is sign mark exist in input string
    int32 signExist = ((base == DEC || base == OCT) && *value == '-');

    // first non zero digit in input number
    int32 non_zero_index = signExist;

    // locate first non zero index
    while(non_zero_index < str_len && value[non_zero_index] == 0) non_zero_index++;

    // if non_zero_index equal length then all digits are zero
    if (non_zero_index == str_len) return false;

    // get number of digits that actually represent the number
    int32 diff = str_len - non_zero_index;

    // if difference less than 10 digits then no overflow will happened
    if (diff < number_sizes[base]) return false;
    // if difference greater than 10 digits then overflow will happened
    if (diff > number_sizes[base]) return true;

    // left digit in input and search strings
    int8 left1 = 0, left2 = 0;

    // if digits equal to 10 then loop over digits from left to right and compare
    for (int32 i = 0; non_zero_index < str_len; non_zero_index++, i++)
    {
        // get input digit
        left1 = value[non_zero_index];
        // get match digit
        left2 = max_numbers[signExist][i];

        // if digits not equal then if left1 is greater overflow will occurred, false otherwise
        if (left1 != left2) return left1 > left2;
    }

    // overflow won't happened
    return false;
}
Run Code Online (Sandbox Code Playgroud)

可以优化该算法以适用于所有整数类型,但是使用浮点数我必须使用新的算法来处理IEEE浮点表示.

我认为编译器使用有效的算法来检测除了我的溢出,不是吗?

Cha*_*tin 6

编译器几乎以最简单的方式处理它:它们将数字转换为整数或浮点数.没有法律规定编译器不能将字符串转换为适当的其他表示形式.

但现在,考虑一下你原来的问题; 如果你把数字和刚构建的例程视为数字呢?比方说,一个可以采取的算法

6 + 5

并将总和计算为两位数的字符串11?将其扩展到其他操作,您可以计算是否 32769大于32768直接.

  • 嗯,更大.但你不需要这样做就知道`INT_MAX` +`INT_MAX`>'INT_MAX`.有很多选择,一些决定可能取决于底层硬件; 例如,有没有办法检测溢出?如果你坚持,我们可以为我们提供某种类型的BigNum实现,交易空间和性能,以保证没有现实的溢出机会.此外,在C++中,您无法保证编译器甚至会*检测*溢出 - 编译器可以处理它的一种方法是将责任留给您. (2认同)