如何交叉两个范围数组?

Ion*_*zău 10 javascript arrays algorithm range

设一个范围是两个整数的数组:startend(例如[40, 42]).

有两个范围数组(已排序),我想找到计算其交集的最佳方法(这将导致另一个范围数组):

A = [[1, 3], [7, 9], [12, 18]]
B = [[2, 3], [4,5], [6,8], [13, 14], [16, 17]]
Run Code Online (Sandbox Code Playgroud)

路口:

[[2, 3], [7, 8], [13, 14], [16, 17]]
Run Code Online (Sandbox Code Playgroud)

这个的最佳算法是什么?


天真的方式是用其他所有方法检查每一个,但这显然不是最佳的.

我发现了一个类似的问题,在VBA中要求相同的东西:两个范围数组的交集

Ted*_*opp 6

由于输入数组已经排序,因此这应该非常简单.我假设任何一个输入数组中的范围彼此不相交(否则,"已排序"将是不明确的).考虑从每个阵列(由"电流范围"的索引定义的一个范围ab).有几种情况(除了"完全重叠"之外的每种情况都有一个镜像图像,其中AB反转):

没有交集:

A[a]: |------|
B[b]:          |---|
Run Code Online (Sandbox Code Playgroud)

因为数组是排序的,A[a]所以不能交叉任何内容B,因此可以跳过(增量a).

部分重叠(B[b]超出范围A[a]):

A[a]: |-------|
B[b]:      |-------|
Run Code Online (Sandbox Code Playgroud)

在这种情况下,将交集添加到输出然后递增,a因为A[a]不能与其他任何内容相交B.

遏制(可能有一致的结束):

A[a]: |------|
B[b]:   |--|
Run Code Online (Sandbox Code Playgroud)

再次将输出添加到输出和此时间增量b.请注意,进一步的轻微优化是,如果A[a]B[b]以相同的值结束,那么您也可以增加b,因为B[b]也不能与其他任何内容相交A.(重合端的情况可能已经集中在部分重叠的情况下.这种情况可能被称为"严格控制".)

完全重叠:

A[a]: |------|
B[b]: |------|
Run Code Online (Sandbox Code Playgroud)

交点添加到输出和增量都ab(均未范围可以相交别的其他阵列中).

继续迭代上面的任何一个,a或者b运行相应数组的末尾,你就完成了.

将上述内容翻译成代码应该是一件容易的事.

编辑:备份最后一句话(好吧,这不是微不足道),这是我的代码中的上述版本.由于所有情况,这有点乏味,但每个分支都非常简单.

const A = [[1, 3], [7, 9], [12, 18]];
const B = [[2, 3], [4, 5], [6, 8], [13, 14], [16, 17]];

const merged = [];

var i_a = 0,
    i_b = 0;

while (i_a < A.length && i_b < B.length) {
  const a = A[i_a];
  const b = B[i_b];

  if (a[0] < b[0]) {
    // a leads b
    if (a[1] >= b[1]) {
      // b contained in a
      merged.push([b[0], b[1]]);
      i_b++;
      if (a[1] === b[1]) {
        // a and b end together
        i_a++;
      }
    } else if (a[1] >= b[0]) {
      // overlap
      merged.push([b[0], a[1]]);
      i_a++;
    } else {
      // no overlap
      i_a++;
    }
  } else if (a[0] === b[0]) {
    // a and b start together
    if (a[1] > b[1]) {
      // b contained in a
      merged.push([a[0], b[1]]);
      i_b++;
    } else if (a[1] === b[1]) {
      // full overlap
      merged.push([a[0], a[1]]);
      i_a++;
      i_b++;
    } else /* a[1] < b[1] */ {
      // a contained in b
      merged.push([a[0], a[1]]);
      i_a++;
    }
  } else /* a[0] > b[0] */ {
    // b leads a
    if (b[1] >= a[1]) {
      // containment: a in b
      merged.push([a[0], b[1]]);
      i_a++;
      if (b[1] === a[1]) {
        // a and b end together
        i_b++;
      }
    } else if (b[1] >= a[0]) {
      // overlap
      merged.push([a[0], b[1]]);
      i_b++
    } else {
      // no overlap
      i_b++;
    }
  }
}
console.log(JSON.stringify(merged));
Run Code Online (Sandbox Code Playgroud)

您要求最佳算法.我相信我的非常接近最佳状态.它以线性时间运行,具有两个数组中的范围数,因为每次迭代完成至少一个范围(有时是两个)的处理.它需要恒定的内存以及构建结果所需的内存.

我应该注意,与CertainPerformance的答案不同(我写这篇文章的时候发布的唯一其他答案)我的代码适用于任何类型的数值范围数据,而不仅仅是整数.(您可能要替换=====在上面,如果你混合数字和数字的字符串表示).CertainPerformance的算法将范围展平为跨越范围的连续整数数组.如果整数的总数是n,那么他的算法在O(n 2)时间和O(n)空间中运行.(例如,如果其中一个范围是[1,50000],则需要50,000个数字的存储器和与其平方成正比的时间.)