这项由MIT(麻省理工学院)、丰田研究院等机构的研究人员共同完成的研究发表于2025年9月,论文题目为《图像扩散模型中的局部性来自数据统计》。感兴趣的读者可以通过arXiv:2509.09672v1访问完整论文,研究网站为https://locality.lukoianov.com。
当我们观察AI绘画时,会发现一个有趣现象:AI似乎具有某种"局部思维"——在画一只眼睛时,它主要关注眼睛周围的区域,而不会被画面另一端的帽子所干扰。长期以来,科学家们认为这种现象源于卷积神经网络的结构特性,就像戴着一副只能看到小范围的眼镜一样,AI天生就被限制只能关注局部区域。
然而,MIT的研究团队通过深入分析发现,事实并非如此简单。他们的研究表明,AI的这种"局部思维"实际上来源于训练数据中像素之间的相关性,而不是网络架构本身的限制。这就像是一个人学会了绘画技巧,不是因为眼镜的限制,而是因为通过观察大量画作领悟到了"相邻区域往往具有相似特征"这一规律。
这个发现颠覆了我们对AI绘画机制的传统认知。研究团队发现,即使是没有明显"局部限制"的Transformer架构(类似于具有全视野的