Ruby的max函数命令如何重复？

Question

Ruby的max函数命令如何重复？

Riv*_*ver 7 c ruby max semantics ruby-2.4

我一直在看Ruby的mixin(v2.4.1)中的max方法Enumerable.

这是一种相当简单的方法,但是当重复项存在时它如何命令项目有点令人困惑.

例如:

x = [1,2,3,4,5,6,7,8,9]
x.max {|a, b| a%2 <=> b%2}
=> 1
10.times{|y| p x.max(y) {|a, b| a%2 <=> b%2}}
[]
[1]
[1, 7] # why is 7 the next element after 1?
[3, 1, 5] # why no more 7?
[7, 3, 1, 5] # 7 is now first
[9, 7, 3, 1, 5]
[9, 7, 3, 1, 5, 6]
[9, 7, 3, 1, 5, 4, 6]
[9, 7, 3, 1, 5, 2, 4, 6]
[9, 7, 5, 3, 1, 8, 6, 4, 2] # order has changed again (now seems more "natural")

Run Code Online (Sandbox Code Playgroud)

如何7选择第二项？为什么在采用三个值时根本不选择它？

如果您采用更多数字,则排序不一致(尽管集合中的项目是).

我已经看了一下源代码,但似乎正在进行正常比较; 从这个代码看,这里看到的顺序并不明显.

任何人都可以解释如何实现这种排序？我知道上面的排序都是"有效的",但它们是如何产生的？

Answer 1

tuk*_*kan 5

您可以通过使用 max_by 来简化您的示例以产生类似的结果：

10.times{|y| p x.max_by(y) {|t| t%2}}

我花了一些时间在源上，但找不到任何漏洞。

在我记得看到一篇名为Switch: A Deep Embedding of Queries into Ruby （Manuel Mayr 的论文）的出版物后，我找到了答案。

您可以在第 104 页的何处找到以下问题的答案max_by：

... 这里，返回输入列表中由函数求值时假定最大值的值。如果超过一个值产生最大值，则在这些值中选择一个结果是任意的。...

类似的：
sort&sort_by来自评论@ emu.c

不保证结果稳定。当两个键相等时，对应元素的顺序是不可预测的。

首先，第二次编辑- “我们需要更深入” => 我希望你会喜欢“骑行”。

答案很简单：
究其原因，max_by块排序看上去就像它的组合（原因入手排序max值从%2它1然后将它与继续0）和qsort_r（BSD快速排序）来实现@ruby。

长答案： 全部基于 ruby 2.4.2 或当前 2.5.0（正在开发）的源代码。

快速排序算法可能因您使用的编译器而异。您可以使用 qsort_r：GNU 版本、BSD 版本（您可以查看configure.ac）了解更多信息。Visual Studio 使用的是 2012 或更高版本的 BSD 版本。

+Tue Sep 15 12:44:32 2015  Nobuyoshi Nakada  <nobu@ruby-lang.org>
+
+   * util.c (ruby_qsort): use BSD-style qsort_r if available.

Run Code Online (Sandbox Code Playgroud)

Thu May 12 00:18:19 2016  NAKAMURA Usaku  <usa@ruby-lang.org>

    * win32/Makefile.sub (HAVE_QSORT_S): use qsort_s only for Visual Studio
      2012 or later, because VS2010 seems to causes a SEGV in
test/ruby/test_enum.rb.

Run Code Online (Sandbox Code Playgroud)

如果您有 GNU qsort_r 但没有 BSD：仅使用内部 ruby_qsort 实现。检查util.c以了解ruby_qsort(void* base, const size_t nel, const size_t size, cmpfunc_t *cmp, void *d)由 Tomoyuki Kawamura编写的快速排序 ( ) 函数的内部实现。 @util.h

如果 HAVE_GNU_QSORT_R=1 则#define ruby_qsort qsort_r：
```
#ifdef HAVE_GNU_QSORT_R
#define ruby_qsort qsort_r
#else    void ruby_qsort(void *, const size_t, const size_t,
    int (*)(const void *, const void *, void *), void *);
#endif
```
Run Code Online (Sandbox Code Playgroud)
如果检测到 BSD 样式：则使用以下代码（可在util.c 中找到）。注意cmp_bsd_qsort之前是如何调用的ruby_qsort。原因？可能是标准化、堆栈空间和速度（我自己没有测试过 - 必须创建基准测试，这非常耗时）。

BSD qsort.c 源代码中指示了节省的堆栈空间：

    /*
    * To save stack space we sort the smaller side of the partition first
    * using recursion and eliminate tail recursion for the larger side.
    */

Run Code Online (Sandbox Code Playgroud)

ruby 源代码中的 BSD 分支：

     #if defined HAVE_BSD_QSORT_R
    typedef int (cmpfunc_t)(const void*, const void*, void*);

    struct bsd_qsort_r_args {
        cmpfunc_t *cmp;
        void *arg;
    };

    static int
    cmp_bsd_qsort(void *d, const void *a, const void *b)
    {
        const struct bsd_qsort_r_args *args = d;
        return (*args->cmp)(a, b, args->arg);
    }

    void
    ruby_qsort(void* base, const size_t nel, const size_t size, cmpfunc_t *cmp, void *d)
    {
        struct bsd_qsort_r_args args;
        args.cmp = cmp;
        args.arg = d;
        qsort_r(base, nel, size, &args, cmp_bsd_qsort);
    }

Run Code Online (Sandbox Code Playgroud)

如果您使用 MSYS2 在 Windows 上编译您的 ruby（不再是 DevKit，而是用于 Windows 安装程序的 MSYS2，我大部分时间都在使用）qsort_r 的 NetBSD 版本（从 02-07-2012 开始）。最新的 NetBSD qsort.c (revision:1.23)。

现在对于现实生活中的例子——“我们需要更深入”

测试将在两个（windows）红宝石上进行：

第一个 ruby：将基于DevKit版本2.2.2p95（2015 年 4 月 13 日发布）并且不包含 BSD qsort 实现。
第二个 ruby：将基于MSYS2 tool-chainruby 版本2.4.2-p198（于 2017 年 9 月 15 日发布）并且包含用于 BSD qsort 实现的补丁（见上文）。

编码：

x=[1,2,3,4,5,6,7,8,9]
10.times{|y| p x.max_by(y) {|t| t%2}}

Run Code Online (Sandbox Code Playgroud)

红宝石2.2.2p95：

The result:
[]
[5]
[7, 1]
[3, 1, 5]
[7, 3, 1, 5]
[9, 7, 3, 1, 5]
[5, 9, 1, 3, 7, 6]
[5, 1, 9, 3, 7, 6, 4]
[5, 1, 3, 7, 9, 6, 4, 2]
[9, 1, 7, 3, 5, 4, 6, 8, 2]

Run Code Online (Sandbox Code Playgroud)

红宝石2.4.2-p198：

The result:
[]
[1]
[7, 1]
[5, 3, 1]
[5, 7, 3, 1]
[5, 9, 7, 3, 1]
[5, 1, 9, 7, 3, 6]
[5, 1, 3, 9, 7, 4, 6]
[5, 1, 3, 7, 9, 2, 6, 4]
[9, 1, 3, 7, 5, 8, 4, 6, 2]

Run Code Online (Sandbox Code Playgroud)

现在对于不同的x： x=[7,9,3,4,2,6,1,8,5]

红宝石2.2.2p95：

The result:
[]
[1]
[9, 7]
[1, 7, 3]
[5, 1, 7, 3]
[5, 1, 3, 9, 7]
[7, 5, 9, 3, 1, 2]
[7, 9, 5, 3, 1, 2, 4]
[7, 9, 3, 1, 5, 2, 4, 8]
[5, 9, 1, 3, 7, 4, 6, 8, 2]

Run Code Online (Sandbox Code Playgroud)

红宝石2.4.2-p198：

The result:
[]
[9]
[9, 7]
[3, 1, 7]
[3, 5, 1, 7]
[7, 5, 1, 3, 9]
[7, 9, 5, 1, 3, 2]
[7, 9, 3, 5, 1, 4, 2]
[7, 9, 3, 1, 5, 8, 2, 4]
[5, 9, 3, 1, 7, 2, 4, 6, 8]

Run Code Online (Sandbox Code Playgroud)

现在对于源数组中的相同项目（qsort 不稳定，见下文）： x=[1, 1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

使用以下代码处理它： 12.times{|y| p x.max_by(y) {|t| t%2}}

红宝石2.2.2p95：

The result:
[]
[3]
[1, 1]
[9, 1, 7]
[3, 9, 1, 7]
[5, 3, 9, 1, 7]
[1, 5, 3, 9, 1, 7]
[5, 9, 3, 7, 1, 1, 1]
[1, 5, 9, 1, 7, 1, 3, 4]
[1, 1, 5, 9, 1, 7, 3, 4, 2]
[1, 1, 1, 5, 7, 3, 9, 4, 2, 8]
[9, 1, 7, 1, 5, 3, 1, 2, 6, 8, 4]

Run Code Online (Sandbox Code Playgroud)

红宝石2.4.2-p198：

The Result:
[]
[1]
[1, 1]
[7, 9, 1]
[7, 3, 9, 1]
[7, 5, 3, 9, 1]
[7, 1, 5, 3, 9, 1]
[1, 5, 9, 3, 7, 1, 1]
[1, 1, 5, 9, 3, 7, 1, 4]
[1, 1, 1, 5, 9, 3, 7, 2, 4]
[1, 7, 3, 1, 5, 9, 1, 2, 4, 8]
[9, 3, 1, 7, 1, 5, 1, 2, 8, 6, 4]

Run Code Online (Sandbox Code Playgroud)

现在是大问题--> 现在为什么结果不同？

第一个明显的答案是，当使用 GNU 或 BSD 实现时，结果会有所不同吗？对？好吧，实现是不同的，但产生（检查链接的实现以获取详细信息）相同的结果。问题的核心在别处。

真正的问题是算法本身。当使用快速排序时，你得到的是不稳定的排序（当你比较两个相等的值时，它们的顺序不会保持不变）。当你有你的 [1,2,3,4,5,6,7,8,9] 然后你在块中转换为 [1,0,1,0,1,0,1,0,1]使用 max(_by) 将数组排序为 [1,1,1,1,1,0,0,0,0]。你从 1 开始，但是是哪一个？那么你会得到不可预测的结果。（max(_by) 是先获取奇数然后获取偶数的原因）。

请参阅GNU qsort评论：

警告：如果两个对象比较相等，则它们排序后的顺序是不可预测的。也就是说，排序是不稳定的。当比较仅考虑部分元素时，这可能会有所不同。具有相同排序键的两个元素可能在其他方面有所不同。

现在像引擎一样对其进行排序：

[1,2,3,4,5,6,7,8,9]-> 首先考虑的是奇数[1,3,5,7,9]，这些被认为与max_by{|t| t%2}products相等[1,1,1,1,1]。

结论：

现在拿哪一个？那么在你的情况下这是不可预测的，它是你得到的。即使对于相同的 ruby 版本，我也会得到不同的结果，因为底层的快速排序算法本质上是不稳定的。

归档时间：	8 年，2 月前
查看次数：	428 次
最近记录：	8 年，1 月前