在 NEAT 算法中调整适应度

won*_*der 6 machine-learning neural-network genetic-algorithm

我正在从以下论文中了解 NEAT:http : //nn.cs.utexas.edu/downloads/papers/stanley.ec02.pdf

我无法理解调整后的适应度如何惩罚大型物种并阻止它们支配种群,我将通过一个例子来证明我目前的理解,希望有人能纠正我的理解。

假设我们有两个物种,A 和 B,物种 A 在上一代做得很好,并给了更多孩子,这一代他们有 4 个孩子,他们的适应度是 [8,10,10,12] 而 B 有 2 个和他们的适应度是 [9,9] 所以现在他们调整后的适应度将是 A[2, 2.5, 2.5, 3] 和 B[4.5, 4.5]。

现在关于分配孩子,该论文指出:“每个物种被分配一个潜在不同数量的后代f'_i,与其成员生物的调整适应度总和成比例”

所以调整适应度的总和是 A 的 10 和 B 的 9 因此 A 得到更多的孩子并不断增长,那么这个过程如何惩罚大型物种并防止它们支配种群?

sea*_*erd 3

好问题!我完全同意这篇论文(特别是你引用的部分)说后代是根据一个物种内调整后的适应度的总和来分配的。由于调整后的适应度是通过将适应度除以物种成员的数量来计算的,因此这在数学上相当于根据每个物种的平均适应度分配后代(如您的示例所示)。正如你所说,这本身不应产生限制大型物种生长的效果。

除非我遗漏了什么,否则论文中没有足够的信息来确定是否 A)论文中未提及的其他实现细节导致该选择方案具有所述效果,B)这是写作中的错误论文的内容,或 C) 这就是算法的实际实现方式,而物种形成并没有像作者认为的那样有帮助。

关于选项A:在你引用的那句话之后,论文说“物种通过首先消除种群中表现最差的成员来繁殖。然后整个种群被每个物种中剩余生物的后代所取代。” 可以这样实施,即每个物种主要替换其自身最弱的生物体,这将使竞争主要发生在物种内部。这是一种称为拥挤的技术(在本文引用的 Mahfoud,1995 年论文中介绍),它可以与健身共享产生类似的效果,特别是如果它与某些其他实施决策相结合。然而,如果他们这样做了,却没有提及,然后说他们正在使用健身共享而不是拥挤,那就太奇怪了。所以我认为这个解释不太可能。

关于选项 B:大多数计算机科学期刊论文(例如这篇论文)都是基于最初提出该工作的会议论文组。大部分 NEAT 形态研究的会议论文如下: https: //pdfs.semanticscholar.org/78cc/6d52865d2eab817aaa3efd04fd8f46ca8b61.pdf。在对适应度共享的解释中,该论文说:“物种的增长或缩小取决于它们的平均调整适应度是高于还是低于种群平均水平”(强调是我的)。这与您链接的论文中提到的调整后的适应度总和不同。如果他们实际上使用的是平均值(并且错误地说了总和),那么他们实际上会除以每个物种的成员数量两次,这将使所有其他声明准确,并使数据有意义。

关于选项 C:这似乎不太可能,因为图 7 看起来稳定共存的时间肯定比您预期的要长,而且没有某种负频率依赖性。而且,他们显然投入了大量精力来剖析物种形成的影响,所以我不认为他们会错过这样的事情。尤其是在一篇如此有影响力的论文中,很多人都以此为基础。

所以,总的来说,我想说我的钱是在解释 B 上——这是一个单词错误,它极大地改变了含义。但很难确定。