为什么 C 中不允许给数组赋值?

c-x*_*ger 6 c arrays standards

如果我写:

int some_arr[4];
some_arr = {0, 1, 2, 3};
Run Code Online (Sandbox Code Playgroud)

然后我的编译器(在本例中为 GCC)会抱怨我之前没有表达式{。所以我需要使用复合文字,很好:

int some_arr[4];
some_arr = (int[]){0, 1, 2, 3};
Run Code Online (Sandbox Code Playgroud)

现在我们看到我不允许为数组赋值。

什么?

我可以用类似memcpy(some_arr, (int[]){0, 1, 2, 3}, sizeof(int[4])), 或通过some_arr逐一分配给每个元素(或通过循环)来“规避”这个问题。我无法想象 GCC 无法解析我所写的单个分配(一个不关心用户的懒惰编译器甚至可能在预处理器中完成它),所以它似乎归结为“标准说不”。那么为什么标准说这个特定的东西是禁止的呢?

我并不是在寻找标准中不允许这样做的语言,而是在寻找关于标准的这一部分是如何形成的历史教训。

Ton*_*ous 5

来自 ISO/IEC 9899:1999 关于赋值运算符的约束

§6.5.16 赋值运算符应具有可修改的左值作为其左操作数。

然后在可修改的左值上

§6.3.2.1 可修改左值是不具有数组类型、不具有不完整类型、不具有 const 限定类型的左值,并且如果它是结构或联合,则不具有任何成员(包括,递归地,所有包含的聚合或联合的任何成员或元素)具有 const 限定类型。

为什么不?可能是因为数组名称很可能衰减为指向第一个元素的指针。


但是,允许由结构体包装的数组赋值,如下所示:

//gcc 5.4.0

#include  <stdio.h>

struct A
{
    int arr[3];
    int b;
};

struct A foo()
{
    struct A a = {{1, 2, 3},10};
    return a;
}

int main(void)
{
    struct A b = foo();
    for (int i=0; i<3; i++)
          printf("%d\n",b.arr[i]);
    printf("%d\n", b.b);
}
Run Code Online (Sandbox Code Playgroud)

产量

1
2
3
10
Run Code Online (Sandbox Code Playgroud)

  • 理由很简单,里奇不想混淆指针赋值和数组赋值。在 B 语言中,所有数组都与指向第一个元素的指针一起分配。但这与 C 结构的概念不太相符,结构应该直接对应于内存。因此,Ritchie 摆脱了 B 存储地址的方式,并引入了数组衰减,这意味着当在表达式中使用数组时,您将获得指向第一个元素的指针。而不是B语言中第一个元素为指针的方式。全部都在链接的副本中。 (2认同)

roo*_*oot 5

长话短说:博士

\n\n

因为 C决定数组衰减为指针,并且没有为程序员提供避免它的方法。

\n\n

长答案

\n\n

当你写的时候

\n\n
int arr[4];\n
Run Code Online (Sandbox Code Playgroud)\n\n

从那一刻起,每次arr在动态上下文中使用时,C 都会认为arr&arr[0],即数组到指针的衰减(另请参见此处此处)。

\n\n

所以:

\n\n
arr = (int[]){0, 1, 2, 3};\n
Run Code Online (Sandbox Code Playgroud)\n\n

被认为是

\n\n
&arr[0] = (int[]){0, 1, 2, 3};\n
Run Code Online (Sandbox Code Playgroud)\n\n

不能被分配。编译器可以使用 实现完整的数组复制memcpy(),但是 C 必须提供一种方法来告诉编译器何时衰减为指针,何时不衰减。

\n\n

请注意,动态上下文与静态上下文不同。sizeof(arr)&arr是在编译时处理的静态上下文,其中arr被视为数组。

\n\n

同样,初始化

\n\n
int arr[4] = {0, 1, 2, 3};\n
Run Code Online (Sandbox Code Playgroud)\n\n

或者

\n\n
int arr[] = {0, 1, 2, 3};\n
Run Code Online (Sandbox Code Playgroud)\n\n

是静态上下文 - 这些初始化发生在程序加载到内存中、甚至在执行之前。

\n\n

标准中的语言是:

\n\n
\n

除非它是 sizeof 运算符或一元 & 运算符的操作数,或者是用于初始化数组的字符串文字,否则类型为 \xe2\x80\x98\xe2\x80\x98array 类型为 \xe2\x80 的表达式\x99\xe2\x80\x99 转换为类型为 \xe2\x80\x98\xe2\x80\x98 的表达式,指向类型\xe2\x80\x99\xe2\x80\x99 的指针,该指针指向数组的初始元素对象并且不是左值。如果数组对象具有寄存器存储类,则行为未定义。

\n
\n\n

当数组位于结构内部时,例如

\n\n
struct s {\n    int arr[4];\n};\nstruct s s1, s2;\n
Run Code Online (Sandbox Code Playgroud)\n\n

然后再次使用s1.arr就像&s1.arr[0],并且不能分配。

\n\n

但是,虽然s1 = s2是动态上下文,但并不引用数组。编译器知道它需要复制整个数组,因为它是结构定义的一部分,并且此赋值是隐式生成的。例如,如果编译器选择使用 实现结构体赋值memcpy(),则会自动复制数组。

\n

  • 这是[回避问题](https://en.wikipedia.org/wiki/Begging_the_question)。该语言可以简单地将可修改左值的异常添加到静态上下文的定义中,并从可修改左值中删除数组的异常。语言定义的复杂性将保持不变……C 的具体选择没有内在的、自然的原因。 (3认同)