同一群雌性小鼠住在一起,大家按部就班、有饭一起吃;而雄性小鼠凑到一块,不出几天就分出了“干活儿的”和“蹭饭的”,这种有意思的性别差异,到底是怎么来的?

最近,一项发表于Nature的研究用自动追踪、神经记录和计算机模拟,盯着三只基因一样的小鼠在半自然环境下生活和觅食。

结果发现,它们竟然能自己组织起来,形成稳定的分工。并且,雄性群体中,竞争越激烈,角色分化越明显;而雌性群体则倾向于更平等、更合作的那一套玩法

图片

标题

这一切的背后,竟然与大脑中“腹侧被盖区”这一区域的多巴胺神经元脱不了干系。这项研究不只解释了社会结构是怎么从日常互动里“长”出来的,还第一次清晰地展示:多巴胺如何通过调节探索利用的平衡,在不同性别的小鼠身上,塑造出截然不同的分工模式。

一、研究背景及目的

在动物社会中,分工与合作是群体生存的核心,但个体如何从互动中自发形成稳定角色,其神经机制长期未被阐明。传统的进化博弈论多假设行为是固定的,忽略了学习、神经调控与社会环境的动态反馈。生产者-偷窃者博弈模型虽能描述资源获取策略,却难以解释角色如何实时涌现。

为此,研究团队以同基因型小鼠为模型,结合高精度行为追踪、光纤光度法与强化学习模型,旨在回答:个体差异如何被社会情境放大?多巴胺系统在其中扮演什么角色?性别为何导致截然不同的群体结构?通过构建可控的“微型社会”并操纵神经活动,研究揭示了社会分工形成的多尺度反馈闭环。

二、研究方法及结果

1.孤立小鼠中已见策略分化

研究者首先让雌性或雄性小鼠单独在含有杠杆(按压得食)与食物分配器的环境中生活5天。小鼠主要夜间活动,逐渐学会将杠杆按压与食物获取关联起来

通过原型分析,孤立小鼠被分为两类:完成者(按压后立即取食,完成率高)与储存者(按压频繁但常不取食)

图片

在非社交半自然环境中出现了不同的寻求奖励策略

雌性成为储存者的概率是雄性的两倍。利用光纤光度法记录腹侧被盖区多巴胺神经元活动,发现完成者在学习后在杠杆按压时刻出现明显的相位性活动增强,提示该信号编码了奖赏预测。此外,麻醉状态下完成者的多巴胺神经元自发发放频率高于储存者。这说明,即使在无社会互动时,雌雄小鼠已表现出不同的探索–利用策略倾向

图片

小鼠的寻求奖励策略

2.性别分化的小鼠社会:工人、偷窃者与储存者

研究进一步将三只同性别、任务初始的小鼠共同饲养8天。行为追踪显示,雌雄总按压次数相当,但雌性完成序列的比例显著更低,取食延迟更长

原型分析在社交情境下识别出三个角色:储存者(按压多、完成少、少竞争)工人(频繁完成序列,食物常被同伴取走)偷窃者(几乎不按压,靠吃同伴所得为生)工人与偷窃者竞争明显,储存者则相对回避竞争。角色在第一天即迅速形成并稳定维持。 

令人惊讶的是,86%的雌性被归类为储存者,而87%的雄性属于工人或偷窃者雌性群体几乎全为“储存者三人组”,雄性群体则多为“工人+偷窃者”混合组。管测试显示,支配等级与觅食角色无直接关联,说明社会等级与分工是两个独立维度。

图片

群体中出现了不同的性别依赖性策略

3.多巴胺信号与角色一一对应 

在记录腹侧被盖区多巴胺活动时,所有小鼠在食物送达时均有相位性增强。但在杠杆按压时刻,工人对自己的按压有显著反应(符合奖赏预测),而偷窃者对同伴的杠杆按压产生反应,表明同伴的行为对偷窃者而言已成为奖赏预测信号。

偷窃者的这种反应仅在“聚焦”状态(朝向杠杆或分配器)时出现。在原型空间中,对自己按压的反应在工人和储存者顶点更强,对同伴按压的反应则在偷窃者顶点最强。

麻醉后记录还发现,社交经历使雄性多巴胺神经元发放频率升高,而雌性不变;且越接近储存者原型的个体发放频率越低。这表明,多巴胺能状态既受社会经历塑造,又与角色选择密切相关

图片

社会角色的多巴胺相关性

4.计算模型揭示“探索–利用”权衡是关键 

研究者构建了Q学习模型,核心参数是“逆温度”β,β越高越倾向利用已知策略,越低越爱探索。孤立环境下,高β小鼠像“完成者”,低β像“储存者”。设定雄性β更高,就能复现孤雌雄差异。

群体中更有趣:三只高β电子小鼠即使参数完全相同,也会自发分化为“工人”与“偷窃者”;而低β组始终步调一致。竞争加上一点偶然性(谁先抢到食物),正反馈会放大初始差异:先占便宜者成了偷窃者,同伴被迫多干活变成工人。数学分岔分析表明,β一旦超过临界值,系统就发生对称破缺,出现两种稳定角色。β,就是这个社会开关。

5.混群与神经操控验证模型预测

研究做出三项预测并逐一验证。第一,将一只雄性(高β)加入两只雌性(低β)组,预测会打破雌性均匀性,雄性倾向成为偷窃者。

图片

实验操作流程 

实验证实:混合组中储存者大幅减少,多数三鼠组形成工人–偷窃者组合。将一只经验丰富的偷窃者与两只初始雄性同居,偷窃者在85%的情况下角色发生转变,说明角色非固有,由当前群体动态决定。

另外,通过光遗传提高雄性多巴胺神经元兴奋性(模拟降低有效β),发现三只均被刺激的组中出现了原本雌性典型的储存者;通过化学遗传抑制雌性多巴胺神经元(模拟提高有效β),则三只均被抑制的组中出现了雄性典型的偷窃者。这些操控均在任务开始前完成,证实多巴胺基础活性直接调控分工倾向。

三、总结

本研究首次构建了从个体决策参数到群体社会分工的完整闭环:腹侧被盖区多巴胺系统通过调控“探索–利用”权衡,决定了小鼠在竞争环境中是成为生产者还是偷窃者

雄性因高β值更易因竞争与偶然性分化出工人与偷窃者,雌性则因低β值保持合作与统一。这一机制具有高度可塑性:改变群体组成或调控多巴胺活性即可重塑角色分配。

研究突破了“社会角色由基因固定”的传统观念,揭示分工实为学习、社会反馈与神经状态相互作用的涌现现象,为理解更复杂社会系统中的个体与集体行为提供了全新框架。


参考资料:

[1]Solié, C., Nicolson, A., Justo, R. et al. Dopaminergic mechanisms of dynamical social specialization. Nature (2026). https://doi.org/10.1038/s41586-026-10301-4

撰文:Catherine
编辑:木白
授权转载等事宜请联系梅斯学术管理员
梅斯学术管理员微信bjy1689902068,备注学术转载
图片

点击“阅读原文”,即刻加入科研会员,限时折扣开通中