← 所有笔记
// 认知发育 · Cognitive Development · 参考背景

婴儿认知发育时间线

整理自 Emmanuel Dupoux(EHESS/Meta AI)的研究综述
发育心理学 认知科学 0–14 月图谱
§ 01

为什么 AI 研究者关心婴儿认知?

核心洞察

婴儿在 14 个月内通过几乎纯粹的观察, 习得了物体永久性、重力、生物运动、社会意图等复杂概念——极少有人直接教导。 这正是 LeCun 等人认为 AI 应该效仿的学习方式。

这张图来自 Dupoux 整理的研究综述, 与 LeCun 的自主智能架构报告一起,构成了"以认知科学为参照系来思考 AI"这一研究路线的基础。

关键观察抽象概念(重力、惯性)建立在具体概念(物体永久性)之上,符合层次化学习的直觉
数据效率婴儿用远少于大模型训练所需的"数据"完成学习,提示 sample efficiency 是关键问题
学习方式大量知识通过观察习得,几乎不需要直接干预——对应自监督学习(self-supervised learning)
§ 02

时间线总览

婴儿认知发育时间线(0–14月) 月龄 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 感知 社会 产出 face tracking 面孔追踪 生物运动感知 客体永久性 固体性 自然类别范畴 稳定/支撑 重力/惯性/动量 形状恒常 目标导向动作 帮/阻感知 指点手势 错误信念 原始模仿 情绪感染 爬行 行走
紫色 = 动作/感知 蓝色 = 物体认知 青色 = 物理认知 绿色 = 社会沟通 橙色 = 行为产出
§ 03

感知(Perception)

动作感知 · Actions

~ 0–3 月
face tracking
面孔追踪
用眼睛跟随人脸移动,是最早出现的社会性感知能力,也是注意力系统的早期形态。
~ 3–5 月
biological motion
生物运动感知
能区分"有生命的运动"(点光源行走动画)与机械运动,说明婴儿早期具备 animate/inanimate 的区分能力。
~ 12–14 月
rational, goal-directed actions
理性的、目标导向的动作
理解他人的行为是有意图的、朝向目标的。这是心智理论(Theory of Mind)的前驱能力。

物理认知 · Physics

~ 6–7 月
stability, support
稳定性与支撑
理解物体需要支撑才不会掉落。"违反预期"(违反此规律)会让婴儿凝视更长时间——这是研究范式 violation of expectation(VOE)的基础。
~ 10–12 月
gravity, inertia, conservation of momentum
重力、惯性、动量守恒
更抽象的物理规律,建立在前期具体物理概念之上,体现了认知的层次化发展。

物体认知 · Objects

~ 3–5 月
object permanence
客体永久性
理解物体被遮挡后依然存在,而不是"眼不见即消失"。皮亚杰(Piaget)的经典概念,但近代研究证明比皮亚杰估计的早得多。
~ 4–5 月
solidity, rigidity
固体性与刚性
物体不能穿越另一个固体,且形状固定不变形。
~ 5–8 月
natural kind categories
自然类别范畴
将物体归类为"狗"、"椅子"等自然类别,而不只是识别个体。这是概念泛化(conceptual generalization)能力的早期形态。
~ 12–13 月
shape constancy
形状恒常性
即使从不同角度看,仍能识别物体形状不变——这正是计算机视觉中 3D shape understanding 问题的生物对应。
§ 04

社会沟通(Social Communication)

~ 6–7 月
helping vs hindering
帮助 vs 阻碍
能区分"帮助者"和"妨碍者",倾向于亲近帮助者。Hamlin et al. (2007) 的著名婴儿道德感知实验基于此。
~ 12 月
pointing
指点手势
开始用手指向物体,是共同注意力(joint attention)的关键里程碑,也是语言发育的重要前驱。
~ 13–14 月
false perceptual beliefs
错误知觉信念
开始理解他人可能持有与现实不符的信念——心智理论(Theory of Mind)的早期形式。完整的 ToM 一般在 3–4 岁才成熟。
§ 05

行为产出(Production)

~ 0–2 月
proto-imitation
原始模仿
模仿简单的面部动作(如吐舌头),是学习型模仿行为的最早期形态,也与镜像神经元系统(mirror neuron system)研究相关。
~ 0–3 月
emotional contagion
情绪感染
听到别人哭自己也哭,是同理心(empathy)的最原始形式,也是 LeCun 架构中 Intrinsic Cost 设计"感知他人情绪"驱动的生物基础。
~ 10 月
crawling
爬行
主动移动能力的获得,显著扩展了婴儿的感知范围,反过来加速物理和空间概念的发育。
~ 12 月
walking
行走
直立行走,解放双手。对应机器人研究中 locomotion 是 manipulation 的前提的观察。
§ 06

对 Embodied AI 的启示

层次化学习

抽象概念(重力、惯性)建立在具体概念(物体永久性、类别)之上。VLA 的课程学习(curriculum learning)设计应考虑这种层次结构。

观察式学习

大量知识通过观察而非直接干预习得,支持用大规模视频数据做自监督预训练(self-supervised pretraining),这正是 π₀ 等模型的预训练思路。

Embodiment 的重要性

爬行能力的获得(10月)显著加速了空间和物理概念的发育——这提示"身体与环境的交互"本身就是认知发育的加速器,支持 embodied learning 而非纯文本学习。

Sample efficiency 问题

婴儿用远少于大模型训练所需的"数据"完成学习。原因可能包括:先天结构偏置(inductive biases)、主动探索(active learning)、以及身体交互提供的丰富多模态信号。