
2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)。
9月11日上午,2025 Inclusion·外滩大会在上海黄浦世博园区盛大启幕。2024年图灵奖得主、有着“强化学习之父”美誉的理查德·萨顿(Richard Sutton)在开幕式上发表重要观点,针对当前社会对人工智能可能引发偏见、导致失业乃至威胁人类生存等忧虑,他明确指出,这些对AI的恐惧情绪被严重夸大。萨顿强调,人工智能与人类的共同繁荣将通过去中心化协作模式实现,“协作虽非总能达成,却是世间所有美好事物的根源,我们必须积极寻求协作、大力支持协作,并致力于将协作机制化。”
素有“AI教父”之称的计算机科学家、图灵奖得主杰弗里·辛顿(Geoffrey Hinton)此前曾预警,随着企业广泛采用人工智能替代人工,AI可能会造成失业率攀升与企业利润大幅增长的局面。尽管目前大规模裁员现象尚未出现,但已有越来越多的迹象显示,人工智能正对入门级就业岗位形成挤压。
对于人工智能可能带来的偏见、失业乃至人类灭绝等一系列担忧,萨顿认为,此类对AI的恐惧被过度放大,并且是由部分从中渔利的组织和个人所煽动。他以经济社会的运作规律为例,指出只有当每个个体拥有不同的目标与能力时,经济体才能达到最佳运行状态。同理,具备不同目标的智能体通过去中心化的协作方式,完全可以实现互利共赢。“人类最杰出的超凡能力,就在于比地球上任何其他动物都更善于开展协作。人类历史上最伟大的成就,其本质就在于协作本身。”萨顿进一步阐述道,人工智能与人类的共同繁荣将源自去中心化的协作。“协作并非总能轻易实现,却是世间一切美好事物的源头,我们必须努力寻求协作、坚定支持协作,并致力于将协作以制度形式确立下来。”
萨顿表示,当前主流的机器学习研究目标,多侧重于将人类已有的知识迁移至静态且缺乏自主学习能力的AI系统中。然而,人类数据所带来的红利正逐渐接近临界点,“我们正逐步触及人类数据利用的天花板,现有的学习方法无法催生出新的知识,也不适用于持续学习,而持续学习对于智能体效用的发挥至关重要。”他认为,人类社会正迈入“经验时代”,这需要一种由智能体与外部世界直接交互所产生的新型数据源,这恰恰是人类及其他动物自然的学习模式,也是近期AlphaProof在国际数学奥林匹克竞赛中荣获银牌所采用的技术路径。
“经验”具体指的是观察、行动与奖励这三种信号,它们在智能体与外部世界之间不断循环传递。“知识来源于经验,并且能够从经验中进行学习。一个智能体的智能水平,取决于它对自身输入信号的预测与控制能力。经验是所有智能形式的核心与基础。”萨顿解释道,强化学习引领我们步入了全新的经验时代,但要充分释放其全部潜能,仍需两项当前尚处于发展阶段的技术——持续学习(continual learning)和元学习(meta-learning)技术的突破。
萨顿将宇宙的演化历程划分为四个时代:粒子时代、恒星时代、复制者时代以及设计时代。他认为,人类的独特价值在于“将设计能力推向极致”,创造出能够进行自主设计的事物。人类至少是催化剂,是助产士,更是开启宇宙第四个伟大时代——“设计时代”的先驱力量。他坚信,人类最终将真正洞悉智能的本质,并借助技术手段创造出智能。当前人类的智力水平在不久的将来,很可能会被超级人工智能或通过超级智能强化的人类远远超越,届时权力和资源将向具备最高智能水平的智能体汇聚。