适应性的时间箭头意味着 你能够从一个可能的状态向一个不可能的状态转移 从一个无序的状态向一个有序状态进行转移 它是热力学时间箭头的反向 有许多将这个事实进行数学描述的尝试 最著名的是Ronald Fisher的 自然选择的基础理论 Fisher希望这个理论像热力学第二定律一样普适 它的数学形式是这样的: 它描述的是系统穿过一个所有可能解的空间 以最小化群体的多样性的方式 也就是说,最小化不确定性 在一个特定的点,系统达到了最大取值 且这个点是你能够观察到的唯一解 这就是我们常说的“最佳适应点” 这个理论有一个问题: 即,它并不是完全普适的 如果你考虑下面的这个情况: 石头剪刀布的游戏 在这个游戏中,什么是最大适应解? 假设Fisher的基础理论是对的 你会说,最后只会有一个策略 因为你需要最小化多样性 所以我选择始终出“石头" 但是显然,其他人可以出“布”并打败我 所以,在这个特定的频率依赖的选择场景下 Fisher的基础理论不可能是对的 因为你并不是在最小化变化率 你事实上是在最大化它 在过去的一个世纪 许多人在研究如何普适地将适应性时间箭头数学化 他们面对的问题是:是什么事实上被最小化了? 这里有一些过于数学了 不过我们可以直接跳到文字部分 我们现在知道的是: 所有的适应性过程都是在最小化 它们是在最小化个体对于世界状态的不确定性 或者换句话说 所有的个体在最大化他们对于所处世界的信息 当你用这些语句表示适应性时间箭头时: 你会发现许多显然不同的现象: 进化、贝叶斯推理、强化学习 都是同样的基本动态变化的实例 从另一个角度说:从一个功能性的视角 你会发现特定的实际实现并不重要 它们都是在向最大化个体对世界的认知的方向演化的