Pra*_*rav 970 c++ c++-faq undefined-behavior sequence-points
什么是"序列点"?
未定义的行为和序列点之间的关系是什么?
我经常使用有趣和复杂的表达方式a[++i] = i;
,让自己感觉更好.我为什么要停止使用它们?
如果您已阅读此内容,请务必访问后续问题重新加载未定义的行为和序列点.
(注意:这是Stack Overflow的C++常见问题解答的一个条目.如果你想批评在这种形式下提供常见问题解答的想法,那么发布所有这些的元数据的发布将是这样做的地方.这个问题在C++聊天室中受到监控,其中FAQ的想法一开始就出现了,所以你的答案很可能被那些提出想法的人阅读.)
Pra*_*rav 671
这个答案适用于旧版本的C++标准.该标准的C++ 11和C++ 14版本没有正式包含"序列点"; 操作是'先前排序'或'未排序'或'不确定排序'.净效果基本相同,但术语不同.
免责声明:好的.这个答案有点长.所以在阅读时要有耐心.如果你已经知道这些东西,再次阅读它们不会让你发疯.
先决条件:C++标准的基础知识
标准说
在称为序列点的执行序列中的某些特定点处,先前评估的所有副作用应该是完整的,并且不会发生后续评估的副作用.(§1.9/ 7)
表达式的评估产生一些东西,并且如果另外存在执行环境状态的变化,则表示该表达式(其评估)具有一些副作用.
例如:
int x = y++; //where y is also an int
Run Code Online (Sandbox Code Playgroud)
除初始化操作外,y
由于++
操作员的副作用,其值也会发生变化.
到现在为止还挺好.继续前进到序列点.comp.lang.c作者给出的seq-points的交替定义Steve Summit
:
序列点是尘埃落定的时间点,到目前为止所见的所有副作用都保证完整.
那些是:
§1.9/16
)的评估结束时(完整表达式是一个不是另一个表达式的子表达式的表达式.)1示例:
int a = 5; // ; is a sequence point here
Run Code Online (Sandbox Code Playgroud)
在评估第一个表达式(§1.9/18
)2之后评估以下每个表达式
a && b (§5.14)
a || b (§5.15)
a ? b : c (§5.16)
a , b (§5.18)
(这里,b是逗号运算符;在func(a,a++)
,
不是逗号运算符,它只是参数之间的隔板a
和a++
.因此,该行为是在这种情况下未定义的(如果a
被认为是一个基本类型))在函数体(§1.9/17
)中执行任何表达式或语句之前发生的所有函数参数(如果有)的评估之后,在函数调用(函数是否为内联函数)之后.
1:注意:对完整表达式的评估可以包括对词汇表的评估,这些子表达式不是词性表达式的全部表达式.例如,在计算默认参数表达式(8.3.6)时涉及的子表达式被认为是在调用函数的表达式中创建的,而不是在定义默认参数的表达式中创建的
2:所指示的运算符是内置运算符,如第5节所述.当其中一个运算符在有效上下文中重载(第13节),从而指定用户定义的运算符函数时,表达式指定函数调用和操作数形成一个参数列表,它们之间没有隐含的序列点.
标准将Section §1.3.12
中的Undefined Behavior定义为
行为,例如在使用错误的程序结构或错误数据时可能出现的行为,本国际标准没有规定任何要求3.
当本国际标准忽略对行为的任何明确定义的描述时,也可能预期未定义的行为.
3:允许的未定义行为范围从完全忽略不可预测的结果,在转换或程序执行期间以环境特征(有或没有发出诊断消息)的文档化方式表现,终止翻译或执行(发布诊断信息).
简而言之,未定义的行为意味着任何事情都可能发生在从你的鼻子飞到你女朋友怀孕的守护进程中.
在我开始之前,您必须知道未定义行为,未指定行为和实现定义行为之间的差异.
你也必须知道the order of evaluation of operands of individual operators and subexpressions of individual expressions, and the order in which side effects take place, is unspecified
.
例如:
int x = 5, y = 6;
int z = x++ + y++; //it is unspecified whether x++ or y++ will be evaluated first.
Run Code Online (Sandbox Code Playgroud)
另一个例子在这里.
现在的标准§5/4
说
这是什么意思?
非正式地,它意味着在两个序列点之间不能多次修改变量.在表达式语句中,next sequence point
通常位于终止分号处,并且previous sequence point
位于前一个语句的末尾.表达式也可以包含中间体sequence points
.
从上面的句子中,以下表达式调用未定义的行为:
i++ * ++i; // UB, i is modified more than once btw two SPs
i = ++i; // UB, same as above
++i = 2; // UB, same as above
i = ++i + 1; // UB, same as above
++++++i; // UB, parsed as (++(++(++i)))
i = (i, ++i, ++i); // UB, there's no SP between `++i` (right most) and assignment to `i` (`i` is modified more than once btw two SPs)
Run Code Online (Sandbox Code Playgroud)
但是下面的表达式很好:
i = (i, ++i, 1) + 1; // well defined (AFAIK)
i = (++i, i++, i); // well defined
int j = i;
j = (++i, i++, j*i); // well defined
Run Code Online (Sandbox Code Playgroud)
这是什么意思?这意味着如果一个对象被写入一个完整的表达式,那么在同一个表达式中对它的任何和所有访问都必须直接参与计算要写入的值.
例如,在(在LHS和RHS中)的i = i + 1
所有访问i
都直接涉及要写入的值的计算.所以很好.
此规则有效地将法律表达式约束为在修改之前明显存在访问的表达式.
例1:
std::printf("%d %d", i,++i); // invokes Undefined Behaviour because of Rule no 2
Run Code Online (Sandbox Code Playgroud)
例2:
a[i] = i++ // or a[++i] = i or a[i++] = ++i etc
Run Code Online (Sandbox Code Playgroud)
是不允许的,因为(其中一个)的访问与最终存储在i中的值(发生在i
其中a[i]
)无关i++
,因此没有好的方法来定义 - 无论是为了我们的理解还是编译器 - 是否应在存储增量值之前或之后进行访问.所以行为是不确定的.
例3:
int x = i + i++ ;// Similar to above
Run Code Online (Sandbox Code Playgroud)
在这里跟进C++ 11的答案.
Pra*_*rav 273
这是我之前的答案的后续内容,包含C++ 11相关资料..
先修课程:关系(数学)的基础知识.
是! 这是非常正确的.
序列点已被C++ 11中的Sequenced Before和Sequenced After(以及Unsequenced和Indeterminately Sequenced)关系所取代.
排序之前(§1.9/ 13)是一种关系,它是:
在由单个线程执行的评估之间并引发严格的部分顺序1
正式它意味着给定任意两个评价(见下文) A
和B
,如果A
是之前测序 B
,则执行A
应当先执行B
.如果A
之前没有进行测序B
和B
之前没有进行测序A
,然后A
和B
在未测序 2.
评价A
和B
被不定测序或者当A
前进行测序B
或B
之前测序A
,但它是未指定的,其3.
[注释]
1:严格偏序是一个二元关系 "<"
在一组P
其是asymmetric
,和transitive
的,即,对于所有的a
,b
以及c
在P
中,我们有:
........(I).如果a <b则¬(b <a)(asymmetry
);
........(II).如果a <b且b <c则a <c(transitivity
).
2:未经测试的评估的执行可能重叠.
3:不确定顺序的评估不能重叠,但可以先执行.
在C++ 11中,表达式(或子表达式)的评估通常包括:
值计算(包括确定glvalue评估对象的标识并获取先前分配给对象以进行prvalue评估的值)和
引发副作用.
现在(§1.9/ 14)说:
一个完整的表达相关联的每个值的计算和副作用测序之前与相关联的每一个值的计算和副作用进行评估下一个完整表达.
琐碎的例子:
int x;
x = 10;
++x;
在计算值和副作用之后,对与之相关++x
的值计算和副作用进行排序x = 10;
是! 对.
在(§1.9/ 15)中已经提到过
除非另有说明,否则对个体操作员的操作数和个别表达式的子表达式的评估是不确定的4.
例如 :
int main()
{
int num = 19 ;
num = (num << 3) + (num >> 3);
}
Run Code Online (Sandbox Code Playgroud)
+
员的操作数的评估相对于彼此是不确定的.<<
和>>
操作符的评估相对于彼此是不确定的.4:在一个程序的执行过程中被评估一次以上的表达,未测序和不定测序其子表达式的评估不需要在不同的评价一致的方式进行.
(§1.9/ 15)运算符操作数的值计算在运算符结果的值计算之前排序.
这意味着在x + y
值计算之前,x
并且y
在计算值之前对其进行排序(x + y)
.
更重要的是
(§1.9/ 15)如果标量对象的副作用相对于其中任何一个都没有排序
(a)对同一标量物体的另一个副作用
要么
(b)使用相同标量对象的值进行值计算.
行为未定义.
例子:
int i = 5, v[10] = { };
void f(int, int);
Run Code Online (Sandbox Code Playgroud)
i = i++ * ++i; // Undefined Behaviour
i = ++i + i++; // Undefined Behaviour
i = ++i + ++i; // Undefined Behaviour
i = v[i++]; // Undefined Behaviour
i = v[++i]: // Well-defined Behavior
i = i++ + 1; // Undefined Behaviour
i = ++i + 1; // Well-defined Behaviour
++++i; // Well-defined Behaviour
f(i = -1, i = -1); // Undefined Behaviour (see below)
当调用函数时(无论函数是否为内联函数),与任何参数表达式相关联的每个值计算和副作用,或者使用指定被调用函数的后缀表达式,都会在执行每个表达式或语句之前对其进行排序.叫功能.[ 注意: 与不同参数表达式相关的值计算和副作用未被排序.- 结束说明 ]
表达式(5)
,(7)
而(8)
不要调用未定义的行为.有关更详细的说明,请查看以下答案.
最后注意:
如果您发现帖子中有任何缺陷,请发表评论.高级用户(代表> 20000)请不要犹豫,编辑帖子以纠正拼写错误和其他错误.
Ale*_*exD 26
C++ 17(N4659
)包括一个提议精炼表达式评估顺序的Idiomatic C++
,它定义了更严格的表达式评估顺序.
特别是,增加了以下句子:
8.18赋值和复合赋值运算符:
....在所有情况下,在右和左操作数的值计算之后,以及在赋值表达式的值计算之前,对赋值进行排序. 右操作数在左操作数之前排序.
它使以前未定义的行为的几个案例有效,包括有问题的行为:
a[++i] = i;
Run Code Online (Sandbox Code Playgroud)
然而,其他几个类似的案例仍会导致未定义的行为.
在N4140
:
i = i++ + 1; // the behavior is undefined
Run Code Online (Sandbox Code Playgroud)
但在 N4659
i = i++ + 1; // the value of i is incremented
i = i++ + i; // the behavior is undefined
Run Code Online (Sandbox Code Playgroud)
当然,使用符合C++ 17的编译器并不一定意味着应该开始编写这样的表达式.
Ytt*_*ill 11
我猜这个改变有一个根本原因,让旧的解释更清晰,不仅仅是装饰性的:原因是并发性.未指定的细化顺序仅仅是选择几个可能的连续排序中的一个,这与排序之前和之后完全不同,因为如果没有指定的排序,则可以进行并发评估:旧规则不是这样.例如:
f (a,b)
Run Code Online (Sandbox Code Playgroud)
先前要么是b,要么是b,然后是a.现在,可以使用交错的指令或甚至在不同的核上评估a和b.
归档时间: |
|
查看次数: |
101050 次 |
最近记录: |