来源:AI Alignment Forum 2026-03-11 12:32

精炼的反事实囚徒困境:爆炸决策理论结果主义的尝试

结果 出现 事实 预测 思想

Ihor Kendiukhov 的文章关于独立公理启发我修改了这个思想实验的表述。

Kendiukhov 引用了 Scott Garrabrant

我的看法是,预期效用最大化的概念是一个错误。 [...] 据我所知,每一个关于效用的论证都假设(或暗示)每当你进行观察时,你就不再关心该观察结果不同的可能世界。 [...] 冯·诺依曼没有注意到这个错误,因为他太忙于发明整个领域。当我们发现不可更新性时,我们就应该认识到所有效用理论都是错误的。我认为我们没有注意到。

显然“停止关心观察结果不同的可能世界”被称为(决策理论)结果主义。

我仔细思考了这一点,我意识到不关心观察结果不同的世界的(潜在)缺点可以通过以下思想实验清楚地说明:

精炼反事实囚徒困境:欧米茄,一个完美的预测者,掷硬币并告诉你结果。无论结果是正面还是反面,欧米茄都会解释该场景(包括尚未出现的细节)并要求您支付 1 美元。在它要求你做出决定之前,欧米茄已经预测了如果硬币以相反的方式出现,你会选择什么。如果它预测您不会付款,那么在您做出决定后,它会对您造成价值 100 万美元的损失作为惩罚。

这试图通过构建一种情况来爆炸结果主义,在这种情况下,您可以通过拒绝放弃微不足道的价值,在其他反事实情况下对称地燃烧大量价值。如果你不关心另一个世界,你就会按下这样一个按钮(如果它可能存在的话),因为你会在两个反事实中按下它,无论硬币最终走向何方,你最终都会变得更糟。

 现在你可能会怀疑这样一个按钮的存在,因为你对完美预测器的可能性表示怀疑,但如果你的怀疑得到缓解,那么这个思想实验就会起作用。事实上,我认为,如果所提出的决策理论在没有更深层次问题的情况下无法完美预测,那将是相当令人惊讶的。


其他信息:这是思想实验的改进版本,由 Cousin_It 独立发现,并且我

原始的反事实囚徒困境欧米茄,一个完美的预测者,抛一枚硬币并告诉你它是如何出现的。如果出现正面,Omega 会向您索要 100 美元,然后如果它预测如果出现反面您会支付,则支付您 10,000 美元。如果出现反面,Omega 会向您索要 100 美元,然后如果它预测如果出现正面则您会支付,则支付您 10,000 美元。在这种情况下,它是正面的,它会在你决定之前做出预测。

我对此版本所做的更改可能看起来微不足道,但如果你想要传播思想实验,像这样的小细节就很重要。原始版本只是反事实抢劫的对称版本,但这对解释它的帮助没有我最初希望的那么大。



讨论

相关文章推荐