自主软件

abm*_*bmv 5 c# self

有没有人写过任何代码,应用程序在其生命周期中学习和改进自己(使用存储在 KB 中的观察数据),是否有任何框架?

pax*_*blo 3

我曾经写过一个学习Tic Tac Toe(或Noughts and Crosses)游戏。这算吗?

它基本上维护了一个 3 9元素数组,用于每个游戏状态。在每场比赛结束时,如果它赢了,它将为该场比赛期间的所有状态加一。或者如果丢失了则减去一(包括旋转和镜像以加快学习速度)。

在决定采取何种行动时,它只需要参考几种可能性并选择得分最高的一种即可。

最终变得相当不错,但不是通过扮演一个人,这花了太长时间。它必须自由地玩自己的另一个副本,一个随机机器人和一个硬编码的规则机器人,用于成千上万的游戏。

当我释放它时,它有10个起始智力水平,这只是它学习过程中的不同阶段。

我儿子目前正在与最愚蠢的级别比赛 - 他只有四岁,所以我不想对他太粗暴,所以他们会一起学习(虽然他偶尔会在 上击败我Connect Four,所以也许我应该施加更多压力在他身上)。