正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2022-06-20 22:10

躺平还是内卷?不如算算边际收益

人们惊奇地发现,动物往往会本能地选择最优解决方式,将所得收益最大化。本文来自微信公众号:返朴 (ID:fanpu2019),作者:James V. Stone(英国谢菲尔德大学名誉副教授),翻译:施昊,原文标题:《躺平or内卷,或许这条数学定律能帮你选择最优解》,题图来自:视觉中国


懂得何时适可而止是我们人生中的一大难题。当面对收益递减时,选择坚持,还是放弃当下,以期将来获得更丰厚的回报,这样的困境比比皆是。对于每一座金矿来说,都会到达一个节点——继续开采所得到的黄金不能抵上所付出的成本,一旦这个时间点到了,就是时候放弃开采,开始寻找新的金矿了。


相似的,对于在灌木丛中以毛毛虫为食的鸟来说,当它们获得的卡路里不足以继续寻找更多毛毛虫的时候,也是时候放弃在这里捕食,应转而去另一片灌木丛。同样,对于蜜蜂而言,收集花粉的重量与其所需能量不相匹配的时候,此时应停止收集,该飞回蜂巢了。


幸运的是,数学上有个解决方案——边际价值定理(Marginal value theorem,1976年由美国生态学家Eric Charnov提出)边际效益理论明确指出了何时放弃以获得最大的回报。更重要的是,从最初的最佳觅食理论到大脑如何处理信息,边际价值定理已经有了很广泛的应用。本质上,无论你所付出或收获是什么,边际价值理论提供了一种一般的策略,即将每份付出所得最大化。


捕食中的瓢虫


瓢虫和蚜虫丨图片来源:Greyson Orlando


瓢虫以蚜虫为食,但是看瓢虫吃蚜虫就像看人类吃龙虾,因为蚜虫的外骨骼对于瓢虫来说就像龙虾的外壳对于人类一样,难以直接穿透进食。一开始吃完最多汁的部分之后,往往需要越来越多的努力来获取越来越少的食物。人类面临这个难题往往懂得适可而止,转而享用别的美食。同样的,当瓢虫面临这样的问题,也知道什么时候放弃转而去找另一只蚜虫。


如果瓢虫过早的放弃眼前这只,它将会浪费掉容易获得的一部分食物。相反,如果过迟放弃,大费周章却得到的越来越少,而这三三两两本可以从另一只蚜虫身上轻松获得。显然,有一个既不过早也不太晚、“恰到好处”的时间来放弃。为了弄清楚这个“恰到好处”的时间点何时到来,我们需要更加详细地了解瓢虫的进食行为。


蚜虫类似于龙虾的解剖学性质意味着,如果让一只瓢虫只吃一只蚜虫,那么累计进食的重量会随着喂食时间t的增加而增加,如下图所示。(这个数据来自与R. M. Cook 和B. J.  Cockrell 发表于1978年一篇经典的关于觅食理论的文章[1],这篇文章启发了我们举了瓢虫的示例。)


黑色的点表示t分钟时刻瓢虫进食的食物质量,黑色曲线表示拟合的收益曲线E(t)。


这些数据点可以拟合成收益函数E(t)=a(1-e-bt)。在我们的瓢虫例子里a=10.43,b=0.0245;我们可以用这个收益函数来定义两个量:


1. 即时收益率,r(t)=ΔE(t)/Δt,也就是每个时间周期Δt所增加的卡路里ΔE(t)(比如每分钟增加的卡路里)

2. 移动平均收益率,。这是以某只蚜虫为食t分钟后累积进食的质量,除以寻找这只蚜虫所花费的时间T加上进食的时间t。


这些量都有着相当直观的几何解释。由上述瓢虫的数据点拟合的收益函数如下图所示,展示了在食物在T时刻被发现之后的累积收益E(t)。


图中黑色的曲线是收益函数E(t),曲线的斜率是即时收益率r(t)。红色虚线表示移动平均收益率R(t)。这个图反映了瓢虫过早放弃蚜虫的情况。


在蚜虫被发现之后的点t,我们可以定义一个底边长为T+t,高为E(t)(黑色的垂直虚线)的直角三角形。这个直角三角形的斜边是一条红色的虚线,这条虚线的斜率等于,即移动平均收益率R(t)。这意味着我们可以将移动平均收益率最大化的问题表述为最大化红色虚线的斜率。具体来说,哪一条红色的虚线拥有最大的斜率呢?


在上图中,进食的时间为t=10min,红色的虚线的斜率比较小;如果瓢虫延迟放弃进食,斜率将会变大,它放弃得太早了。如果进食时间超过10分钟,移动平均收益率R(t)将会变大。


瓢虫过迟放弃蚜虫


同样地,如上图所示,进食的时间为t=55min,红色虚线的斜率也比较小,如果瓢虫提前放弃进食,斜率将会变大,它离开得太迟了。如果进食小于55分钟,移动平均收益率R(t)将会变大。


瓢虫在恰好的时间放弃进食。


最后,进食时间t=35min产生了一个可能最大的斜率。这是最优的进食时间,如果此时放弃进食,移动平均收益率R(t)将会最大。


注意到“恰到好处”的进食时间发生在收益曲线的斜率r(t)等于红色虚线的斜率,也就是移动平均收益率R(t)的时刻。换句话说,恰到好处的进食时间发生在即时收益率等于移动平均收益率的时候:r(t)=R(t)。


可以用几何验证,即时收益率r(t)在下图用红色的虚线表示,移动平均收益率R(t)用黑色的实线表示。


红色虚线表明即时收益率,黑色实线表示移动平均收益率


正如我们预料那样,这两条曲线在“恰到好处”的时间相交(也就是r(t)=R(t))。从这种几何角度的分析有效证明了边际价值定理,也就是最佳的退出时间是当即时收益率等于移动平均收益率的时候,也就是当r(t)=R(t)。


数学证明如下:


在下面三个相当弱(温和)的条件下,边际价值定理是成立的:


1. 固定成本T大于0;


2. 收益函数E(t)随着时间t增加而增加;


3. 收益函数的斜率随着时间增加而减少(也就是E(t)是收益增量递减函数)


我们希望证明当R(t)最大时候,即时收益率r(t)等于平均收益率R(t)。为此,我们需要找到当R(t)最大时,r(t)的值。为了找到最大的平均收益率,我们要用到(平均收益率)在它的斜率为0处最大这个事实。


平均收益率被定义为:



以及它的导数是



根据定义,



是即时收益率,以及



把等式(3)和(4)代入到等式(2)中,可以得到



又因为



是平均收益率,所以公式(5)变成了



在最大值处,令上式等于0,



最后在等式两边同时乘上T+t,移项得



这就证明了当即时收益率等于平均收益率得时候,平均收益率将会达到最大。


瓢虫懂得边际价值定理


上述的分析假设了一个恒定不变的搜索时间T。但是,对边际价值定理一个妥当的检验应涉及到可变的搜索时间。本质上来讲,较长的搜索时间表明食物比较稀缺,因此相应地增加进食每只蚜虫的时间是有道理的。换句话说,在一只蚜虫身上花费的进食时间应该随着寻找到这只蚜虫所花费的时间增加而增加。


然而,相比于这个正确但是模糊的结论,边际价值理论精准地预测了进食时间该如何随着搜索时间增加而增加,如下图所示。(再次使用了建立在Cook和Cockrell 1978年实验数据的收益函数)


如果用40分钟找到一只蚜虫,瓢虫将会花费50分钟来进食这只蚜虫(红色的虚线);如果用10分钟找到了一只蚜虫,瓢虫将会花费28分钟来进食这只蚜虫(蓝色虚线)。


从上图中我们可以看出,边际价值定理预测以蚜虫为食的时间会随着寻找蚜虫的时间增加而增加。如果找到一只蚜虫需要40分钟,那么瓢虫应该花费大约50分钟来进食(上图中的红色虚线)。如果找到一只蚜虫需要10分钟,那么瓢虫应该只花费大约28分钟来进食(蓝色虚线)


问题是,瓢虫会按照边际价值定理预测的时间放弃进食蚜虫吗?为了回答这个问题,Cook和Cockrell 将蚜虫随机散放在一个托盘里,然后测量瓢虫幼虫找到每只蚜虫所花费的时间T以及进食每只蚜虫所花费的时间t。(Cook和Cockrell 使用了瓢虫幼虫,不过这个并不是很重要。)


瓢虫幼虫平均进食时间如何随着找到一只蚜虫的时间变化:点表示实验中观察值,黑色的线表示由边际价值理论预测的进食时间。


上图显示了Cook 和 Cockrell 观察到的瓢虫幼虫的平均摄食时间如何随着搜索时间变化的:点代表着他们在实验中观察到的结果,黑色的曲线代表着边际价值定理预测的进食时间。经过多次实验,蚜虫的数量渐渐减少,使得搜索新的蚜虫的时间相应地变长。如预测的一样,随着搜索的时间增加(蚜虫的密度降低),每只蚜虫平均被食用的时间也会增加。更重要的是,这样随着搜索时间增加而进食时间增加的方式,在某种程度上和边际价值定理预测的一致,正如上图所示。


在这个特定的例子中,数据和理论之间的拟合不是那么令人印象深刻,这可能因为移动平均收益函数R(t)没有一个尖峰,因此提前一点或者推迟一点放弃进食所损失的收益相对来说比较小。相反,如果收益函数上升的十分陡峭,那么移动平均收益率曲线会有一个更高的锋,那么实验的数据和边际价值定理预测值可能会更加匹配。


动物懂得何时适可而止


瓢虫捕食蚜虫的过程,只是动物在合适的时间放弃进食以达到最大效益的众多例子中的一个。同样的道理也适用于获取宝贵资源所需高昂成本的情况下。


1. 大山雀的伟大


大山雀捕食丨图片来源:Rosember


假设一只大山雀花费了一些时间寻找到有大量毛毛虫的灌木丛。找到灌木丛后,大山雀开始每分钟可以吃到的大量的毛毛虫,但是过了一会儿,可以找到的毛毛虫数量下降了,因此每分钟可以吃到的毛毛虫数量也下降了。鉴于边际收益的递减,大山雀该何时放弃这片灌木丛而选择去寻找新的灌木丛呢?


正如上述的瓢虫例子一样,答案由边际价值定理得出。通过做类似于瓢虫实验的实验,科学家Richard Cowie在1977年发现边际价值理论可以正确预测大山雀放弃灌木丛的时间。


2. 放弃交配


对一只雄性粪蝇来说,知道自己和一个雌性粪蝇交配多久代表一种典型的权衡,即当前有保障的回报,和一个不确定、但可能会获得更大的收益。(译者注:粪蝇生殖过程存在精子竞争(Sperm competition),雌性会与多个雄性交配,每只雄性要尽可能地置换其他雄性的精子。)


雄性粪蝇与雌性粪蝇交配的时间越长,那么之前与这只雌蝇交配的其它雄蝇的精子会被替换的越多,并且这只雌蝇与其它雄蝇交配的机会会越少。换句话说,这只雄性交配的每一分钟,都本可以用来和其他雌蝇交配的。


我们可以发现,寻找新的雌蝇所花费的时间,和前面例子中寻找新的食物来源(新蚜虫和新灌木丛)是类似的,和一只雌蝇交配的时间对应一个增加但是增量减少的收益。因此,边际价值定理能够预测一个雄性的粪蝇应当和每个雌性交配多久以保证尽可能多的后代,对此结果我们不应感到惊讶。1976年,科学家G. A. Parker 和 R. A. Stuart 观察到雄性粪蝇和每只雌性粪蝇的交配时间为36分钟,和边际价值定理预测的41分钟相当。


3. 蜜蜂会因太忙而效率低下吗?


随着蜜蜂收集越来越多的花粉,将花粉带回蜂巢所消耗的能量也会增加。每只蜜蜂都会面临的困境是:蜜蜂什么时候应该停止采集花粉返回蜂巢呢?


在一个极端的情况下,如果蜜蜂仅仅采集了一粒花粉后就返回,那么几乎肯定的往返蜂巢所消耗的能量会超过从花粉粒中获得的能量;另一个极端情况是,如果蜜蜂收集了大量的花粉,那么花粉会收集得很快,但是在飞回蜂巢的路上所消耗的能量将会占据从花粉中获得能量的很大一部分比例。两个极端情况之间有一个恰到好处的承载量——它为飞行中消耗的每一卡路里提供了(因采集花粉而获取的)最大能量。值得注意的是,蜜蜂连续采集花朵导致负载变多,收益是递减的。


科学家Paul Schmid-Hempel, Alejandro Kacelnik 和Alasdair Houston 在1985年的实验中观察到蜜蜂花粉的负载量和边际价值定理预测的相符合。简而言之,就每克收集的花粉所消耗的能量而言,蜜蜂在尽可能有效地收集花粉。相比之下,在一个基于每分钟收集速率最大化的模型下,与负载花粉的量拟合非常差。这表明,蜜蜂更偏向能源的效用化而不是花粉的收集速率。


大脑和边际价值理论


神经元主要职能是处理信息,但是维护神经元的成本非常高,用于传输信息的成本甚至更高,因此它们以最高效率运行是有必要的。


根据香农的信息论,信息的常用单位是比特(bit),它提供了足够的信息来在两个等可能的事件中进行选择,例如抛掷一枚硬币。但是,香农的信息定义了一个普遍的收益递减的规律,这意味着处理每一个比特信息所需要的能量随着每秒处理比特数增加而增加。因此,信息可以慢速低成本地处理或者高速高成本地处理,但是不能高速低成本地处理。


这个收益递减定律和瓢虫每秒吃的食物量的收益递减问题是类似的。不同之处在于,瓢虫想要最大化每秒平均吃掉的食物量,而神经元想要最大化每焦耳能量消耗能处理的平均信息量。鉴于这些相似之处,瓢虫问题和神经元问题都可以使用边际价值定理来解决。



能量效率随着神经元发放的速度变化。曲线的高峰预测了神经元的平均发放频率,与神经元最大化能量效率的想法一致。


边际价值定理可以根据能量消耗(代替进食时间)和信息处理(代替进食收益)来重新定义。由此得出的效率曲线表明,由边际价值理论预测的最大效率(以比特/焦耳为单位)出现在每秒约2个神经元峰值的发放频率下。重要的是,1996年科学家William Levy和Robert Baxter发现这一预测与对神经元的平均发放频率的观察结果是一致的。


因此,无论是用寻找蚜虫花费了多少时间,或者是神经元放电消耗能量,以及用每小时吃掉蚜虫还是每焦耳处理信息比特来衡量,边际价值定理具体说明了付出多少使得收益最大化。


参考资料

[1] https://www.jstor.org/stable/3799

原文:James V. Stone, Knowing when to quit


本文来自微信公众号:返朴 (ID:fanpu2019),作者:James V. Stone(英国谢菲尔德大学名誉副教授),翻译:施昊

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: