AI Insight Hub - 最新人工智能动态

Ihor Kendiukhov 的文章关于独立公理启发我修改了这个思想实验的表述。

Kendiukhov 引用了 Scott Garrabrant：

我的看法是，预期效用最大化的概念是一个错误。 [...] 据我所知，每一个关于效用的论证都假设（或暗示）每当你进行观察时，你就不再关心该观察结果不同的可能世界。 [...] 冯·诺依曼没有注意到这个错误，因为他太忙于发明整个领域。当我们发现不可更新性时，我们就应该认识到所有效用理论都是错误的。我认为我们没有注意到。

显然“停止关心观察结果不同的可能世界”被称为（决策理论）结果主义。

我仔细思考了这一点，我意识到不关心观察结果不同的世界的（潜在）缺点可以通过以下思想实验清楚地说明：

精炼反事实囚徒困境：欧米茄，一个完美的预测者，掷硬币并告诉你结果。无论结果是正面还是反面，欧米茄都会解释该场景（包括尚未出现的细节）并要求您支付 1 美元。在它要求你做出决定之前，欧米茄已经预测了如果硬币以相反的方式出现，你会选择什么。如果它预测您不会付款，那么在您做出决定后，它会对您造成价值 100 万美元的损失作为惩罚。

这试图通过构建一种情况来爆炸结果主义，在这种情况下，您可以通过拒绝放弃微不足道的价值，在其他反事实情况下对称地燃烧大量价值。如果你不关心另一个世界，你就会按下这样一个按钮（如果它可能存在的话），因为你会在两个反事实中按下它，无论硬币最终走向何方，你最终都会变得更糟。

现在你可能会怀疑这样一个按钮的存在，因为你对完美预测器的可能性表示怀疑，但如果你的怀疑得到缓解，那么这个思想实验就会起作用。事实上，我认为，如果所提出的决策理论在没有更深层次问题的情况下无法完美预测，那将是相当令人惊讶的。

其他信息：这是思想实验的改进版本，由 Cousin_It 独立发现，并且我：

原始的反事实囚徒困境欧米茄，一个完美的预测者，抛一枚硬币并告诉你它是如何出现的。如果出现正面，Omega 会向您索要 100 美元，然后如果它预测如果出现反面您会支付，则支付您 10,000 美元。如果出现反面，Omega 会向您索要 100 美元，然后如果它预测如果出现正面则您会支付，则支付您 10,000 美元。在这种情况下，它是正面的，它会在你决定之前做出预测。

我对此版本所做的更改可能看起来微不足道，但如果你想要传播思想实验，像这样的小细节就很重要。原始版本只是反事实抢劫的对称版本，但这对解释它的帮助没有我最初希望的那么大。

讨论

精炼的反事实囚徒困境：爆炸决策理论结果主义的尝试

相关文章推荐

LLM联盟真的需要多样性吗？采用 RLVR 方法进行道德推理的实证研究

CUAAudit：视觉语言模型作为自主计算机使用代理审核员的元评估

通过无奖励自微调代理进行自适应 RAN 切片控制