在`return`结尾添加分号会有所不同吗?

sar*_*gas 6 expression statements rust

锈指南指出:

分号通过丢弃其值并返回单位将任何表达式转换为语句.

我以为我得到了这个概念,直到我做了一个实验:

fn print_number(x: i32, y: i32) -> i32 {
    if x + y > 20 { return x }      
    x + y 
}
Run Code Online (Sandbox Code Playgroud)

编译好.然后,我在返回行(return x;)的末尾添加了一个分号.据我所知,这将该行转换为语句,返回单位数据类型().

尽管如此,最终结果是一样的.

Kan*_*oon 5

通常,if表达式中的每个分支都应该具有相同的类型。如果某个分支的类型未指定,编译器会尝试找到单个公共类型:

fn print_number(x: int, y: int) {
  let v = if x + y > 20 {
    3 // this can be either 3u, 3i, 3u8 etc.
  } else {
    x + y // this is always int
  };
  println!("{}", v);
}
Run Code Online (Sandbox Code Playgroud)

在此代码中,未指定,3else分支强制它具有int.

这听起来很简单:有一个函数可以将两个或多个类型“统一”为公共类型,否则在不可能时它会给你一个错误。但是如果fail!分支中有一个呢?

fn print_number(x: int, y: int) {
  let v = if x + y > 20 {
    fail!("x + y too large") // ???
  } else {
    x + y // this is always int
  };
  println!("{}", v); // uh wait, what's the type of `v`?
}
Run Code Online (Sandbox Code Playgroud)

我希望这fail!不会影响其他分支,毕竟这是一个特例。由于这种模式在 Rust 中很常见,因此引入了发散类型的概念。没有哪个类型正在发散的值。(它也被称为“无人居住类型”或“空类型”,具体取决于上下文。不要与具有单个值的“单位类型”混淆()。)因为发散类型自然是任何其他类型的子集,编译器得出结论v的类型就是else分支的类型,int

Return表达式与fail!用于类型检查的目的没有什么不同。它就像fail!(但不终止任务,谢天谢地)突然从当前的执行流程中逃脱。尽管如此,发散类型不会传播到下一个语句:

fn print_number(x: int, y: int) {
  let v = if x + y > 20 {
    return; // this is diverging
    () // this is implied, even when you omit it
  } else {
    x + y // this is always int
  };
  println!("{}", v); // again, what's the type of `v`?
}
Run Code Online (Sandbox Code Playgroud)

请注意,唯一的分号语句x;等效于表达式x; ()。通常与a; b具有相同的类型b,因此只有当不发散时才x; ()具有类型,并且在发散时才发散,这将是很奇怪的。这就是为什么您的原始代码不起作用的原因。() xx

添加这样的特殊情况很诱人:

  • x; ()发散时为什么不x发散?
  • uint当无法推断其类型时,为什么不假设每个未指定的整数文字?(注意:过去就是这种情况。)
  • 为什么在统一多个 trait 对象时不自动找到共同的 supertrait?

事实是,设计类型系统并不难,但验证它要困难得多,我们希望确保 Rust 的类型系统是面向未来和长期存在的。如果它真的有用并且被证明对我们的目的是“正确的”,其中一些可能会发生,但不会立即发生。


Fra*_*gné 3

我不是 100% 确定我在说什么,但它有点道理。

还有另一个概念正在发挥作用:可达性分析。编译器知道return表达式语句后面的内容是无法访问的。例如,如果我们编译这个函数:

fn test() -> i32 {
    return 1;
    2
}
Run Code Online (Sandbox Code Playgroud)

我们收到以下警告:

fn test() -> i32 {
    return 1;
    2
}
Run Code Online (Sandbox Code Playgroud)

if如果表达式以表达式结尾,编译器可以忽略表达式的“true”分支return,而在确定表达式的类型时仅考虑“false”分支if

您还可以通过不同的函数看到这种行为。发散函数是不能正常返回的函数(例如,它们总是失败)。尝试return用宏替换表达式fail!(它扩展为对发散函数的调用)。事实上,return表达也被认为是发散的;这是前述可达性分析的基础。

()但是,如果语句后面有实际表达式return,则会出现错误。这个功能:

fn print_number(x: i32, y: i32) -> i32 {
    if x + y > 20 {
        return x;
        ()
    } else {
        x + y
    }
}
Run Code Online (Sandbox Code Playgroud)

给出以下错误:

warning: unreachable expression
 --> src/main.rs:3:5
  |
3 |     2
  |     ^
  |
Run Code Online (Sandbox Code Playgroud)

最后,当发散表达式(包括return表达式)后跟分号时,编译器对发散表达式(包括表达式)的处理方式似乎有所不同:该语句仍然是发散的。