胡泳:AI时代,“文科有用”
发布时间:2025-09-08 18:02 浏览量:1
【 精彩观点整理 】
本文为基于胡泳访谈的文字整理
我们可能无法完全量化人工智能对人类整体智力的影响,但是认知卸载导致特定认知技能下降的担忧,比如个体记忆能力的减退,则是完全合理的。人机协作有潜在的危险,就是丧失人类的思想主体性。就像“骆驼挤进帐篷”,等到骆驼整个身躯都挤进来以后,人就被完全顶出帐篷了。就当下发展来看,大模型还远远不能够达到我们作为一个“人”所拥有的那种全部智能和意识…(大模型的智能)几乎只集中在语言智能和部分逻辑推理智能上。使用人工智能需要有一个前提条件:TA必须是一个具备超高信息素养的人。我们的教育体系应该培养会用人工智能工具或者任何工具生产出东西的能力。再往上是沟通协作、批判性思维、创造力,还有自信心,这些是在人工智能时代所需要的关键技能。人工智能时代到来之后,应该设想一个概念,叫做“无分数学习”,把评分体系或者说成绩体系,置换到更具有挑战性的学习任务,并且让学生的注意力回归到更有意义的事情上面。要做到“人的归人,机器的归机器”,不要混淆两者的边界。我们不该只问“人工智能能为人类做什么”,还要问“人工智能正在对人类做什么”。在个体层面上,人工智能是可以帮助个体拓展想象空间的。然而在群体层面,当前生成式系统是否能够产生具有颠覆性的范式创新想法,目前仍是一个尚未明确的问题。人工智能缺少的,是作为一个“人”真正的激情和痛苦。生活中有深刻的个人体验,而这些体验其实是人类创作深刻作品的基础。如果没有了人文社科,我们并不能发现我们自己到底是谁,也就无法与人工智能相处了。AI之于人类,就像“骆驼挤进帐篷”AI是否导致人类降智?要讨论这个问题,首先要定义何为“智力”。
但智力是一个复杂的因素,单一归为某个概念都难以说服他人。相对于“降智”,现在更常用的说法是“认知卸载”,就是说我们一方面承认AI能够接手某些认知能力,但是另一方面它也一定会使你越来越懒于思考。比如AI帮助你写文章、做项目,同时它就会让你不那么积极地动脑,一遇到问题就求助于AI。如果从长期来看,这的确会对认知的发展或是批判性思维能力造成影响。因此,我们所讨论问题的核心就是,当AI接管了更多的任务以后,人类独立完成这一任务的能力就会下降。也就是说,我们可能无法完全量化人工智能对人类整体智力的影响,但是认知卸载导致特定认知技能下降的担忧,比如个体记忆能力的减退,则是完全合理的。
除了很多经过严谨验证的学术的例子,同样有一些生活的例子可以参考。譬如在日常生活中,如果你过度依赖GPS,空间记忆能力就会很差。批判性思维层面的例子也很多。例如,有研究把参与者分成年长者和年轻者作为对照组。结果发现,年长者的批判性得分反而是高于年轻人的,因为他们对AI工具的依赖程度没有那么高。我们可以发现,频繁使用人工智能与较低的批判性思维能力之间,存在着显著关联性。
从另一个角度讲,AI在提高工作效率的同时,也会抑制个体的批判性思维。这可能产生两个结果,第一个结果是,一旦你在工作中丧失了AI支持,就发现自己不会干活了,因为没有AI支持的情况下,你解决问题的能力是会显著下降的;第二,你会发现你很难适应一个没有AI的环境,就像我们对网络过度依赖,突然断网就有可能让你无所适从。如果各种事情都是AI来做,一旦没有了AI,你的适应性是非常差的。从这些维度来衡量,可以说,我们对AI已经产生了一种过度依赖性。而过度依赖性,是跟认知水平、思想规范性、记忆功能以及思维能力的下降显著相关。
从社会平均水平的角度,AI对于智力而言可能是一个利好因素,但是对个体的智力水平来说则不然。
针对智商测量有一个概念,叫“弗林效应”,是由詹姆斯·R.弗林 (James R. F lynn) 在20世纪80年代系统研究并命名的。他经过研究发现,20世纪30年代以来,全球多个高生活水平国家连续几代人的平均智商在持续提升。换句话说,人类变得越来越聪明了。但在最近几年,弗林效应其实是在减缓的,甚至在某地方是在逆转的,换句话说,我们的平均智商现在开始下降。在许多地区,学生的科学、数学和阅读成绩都呈下降趋势。下降的背后,意味着年轻人注意力的长时间持续性在缩短,批判性思维能力在变弱。造成这种现状的原因有很多。比如社交媒体,就是人类注意力的“大杀器”,它毫无疑问是智力下降的一大诱因。也就是说,我们不能单纯地把人工智能当作“替罪羊”,尽管它必然是其中的一个因素。因为智力因素是非常复杂的,受到多种变量的影响。所以从这个意义上来说,也不能轻易断言人类的智力水平在整体上升。我们应该从长期来看人工智能的影响,而不能从短期或者局限地来看。
“认知卸载”更多地强调的是,由于现在人工智能的发展,人类本身拥有的一些能力在下降。其核心指向是,我们自古以来都在用各种各样的方式实现能力的外包或者是卸载。例如,你通过记笔记来减轻认知负荷,其实就是一个典型案例。不是说“认知卸载”或者“外包”就不好,而是人工智能它大大加速了卸载能力的上升。从“记笔记”这种简单的卸载,到现在人工智能开始影响更深层次的东西,例如解决问题的能力或者批判性思维,这些思维能力是人本身就有的,而现在通过工具的发展就会有所丧失。
当然,从文字到互联网,几乎每一次都有“降智”的类似担忧。之前电视媒介刚产生的时候,文化精英主义者非常反对电视,觉得电视就是一个导致人类智能下降的罪魁祸首,后来证明,电视这种媒介其实也并没有那么可怕。但尽管如此,我仍需强调一下:人工智能的技术和过往的技术相比,有本质上的不同。例如蒸汽机或者电力的发明,它们和人工智能的量级完全不匹配。
首先,人工智能的确会直接替代我们的认知功能。我们以前使用计算器来辅助计算,但是现在生成式AI正在直接替代或者执行传统上属于人类的判断、思考和创造等等这些核心的认知活动,并具有强烈的替代可能。这种替代从某种意义上来说,不是简单的工具辅助,而是在很多层面发生了质的飞越。
其次,我们会意识到AI的渗透速度是极其快的,它的覆盖面也是极其广的。AI的技术应用对人们之后的工作、生活,以及心理和精神上的技术性依赖风险要比其他技术高得多。
第三,人工智能仍然具有极大的迷惑性,就是它会模拟真实。人类对于“何为真实”的认知本身就是一笔糊涂账,现在AI生成的这种模拟真实性,会给人类造成很多未知的认知风险。所以,我认为现在固然不可以高唱技术悲观论,也无需陷入道德恐慌中,但AI的一些独特性质也在提醒我们:这种技术是前所未有的,它必须得到严肃全面的审视和管理。
人机协作或者人机共存是一个美好的愿望,我也认为这是一个应当的发展方向。但是此中有潜在的危险,就是丧失掉人类的思想主体性。用寓言“得寸进尺的骆驼进帐篷”(The Camel’s Nose)来说,你先让骆驼的鼻子伸进来,之后是脖子和前腿,等到骆驼整个庞大身躯全部都挤进来以后,人就被完全顶出帐篷。我觉得这种风险是现实存在的。
不要对人类智能妄自菲薄现在很多大模型能够通过法律考试,MBA考试,包括SAT,甚至是医学考试,并且还真能取得不错的成绩。但是,这只能证明它是一个通用型的语言处理器,这在系统设计层面,要承认这是了不起的科技成果。另一方面,尽管现在声称是“人工智能”,但其本质还是一个概率问题,而非真正的理解或推理。最好的例子就是,人工智能就算可以应付医学考试,但是它并没有临床直觉。如果真的让人工智能去做临床,那是风险系数非常高的,因为它本身没有具身认知能力。同时,大模型还不存在原生的学习过程。因为,人类是有学习动力的。人类会一边学习也会一边反思;同样地,还会把反思不断内化到自己的学习过程当中。而大模型完全不具备这种能力。
机器智能跟人类智慧有什么区别?或者只说人类的智能到底是什么东西?答案必然是见仁见智的。今天人们看见人工智能做得好,可能会欢呼说它超越了人类智能。而另一种截然不同的观点则认为,机器智能并不能超越人类智能。在这种罗生门下,当前人工智能领域的研究者时常面临一种“永远往后移的球门柱”的困境:当他们终于突破某项技术瓶颈而欢呼超越了人类智能时,外界随即就会指出其成果距离真正的人类智能水平仍有差距。
智商 (IQ) 确实能衡量人类的某些智能,但一个人智商高,不代表他的全部智能水平就高。所以霍华德·加德纳 (Howard Gardner) 意识到这个问题,他认为我们不能只依赖考试成绩或传统智商测试来评估人类的智力。经过多年的研究,他总结出了八种智能类型。如果用这八种智能来评估大模型,就会发现人工智能在语言智能方面表现是一流的。不论是表达、阅读、写作还是讲故事,生成式AI都是极其超前的。它在逻辑推理或者数学智能上表现也很优秀,尽管在复杂推理时有时会不稳定。但是,人工智能在视觉空间智能上表现很差,以前想象中的多模态模型,实际后来也没有太大动静。之后发展到的具身智能、人形机器人,它们的性能表现其实也比较一般。因为,它们实际上无法很好地控制自己的身体,也不能保证身体的协调能力,可能它的身体动觉连三岁小孩都不如。同样,人机智能或许可以模拟我们的同理心,但是它并不能真正理解他人的情感、动机或关系。
另一个争论点是AI到底有没有意识,有人相信它们已经有了自我意识。但是,这一点也是有反对的声音的,反对者坚定不移地认为其实人工智能根本并没有意识。
其实,就当下发展来看,大模型还远远不能够达到我们作为一个“人”所拥有的那种全部智能和意识。人们之所以会感到恐慌,是因为目前的人工智能发展走偏了。它几乎只集中在语言智能和部分逻辑推理智能上,而在其他类型的智能上几乎没有进展。甚至,它可能因为过度投入这两个方向,而阻碍了其他智能的发展。现有的人工智能在结构上完全无法与人类匹配,尤其是在具身性、情感性、经验性这些方面。因此,我对“人工智能就意味着出现了一个新的物种”这种说法非常不以为然。他们并没有真正理解人类智能,而且对人类智能妄自菲薄,导致对目前的人工智能过度夸大。
生成式AI现在面临的最大障碍是幻觉问题。幻觉的存在让人们不能够百分之百地把它当成知识停止点系统。在这点上,我的观点也不是静态的。不知道随着人工智能的发展,幻觉是否会减少,而且幻觉的减少程度和权重是我们目前不能够预测的。比如, 我的使用经验是 DeepSeek的幻觉就比其他大模型高。我们不能说这个模式不对,因为不同AI的发展模式是不一样的。而且,有可能“幻觉”对于人类来说也是非常重要的。在知识层面,幻觉是有问题的,但从创意的角度来说,幻觉当然是合适的,尽管也可能造成很多矛盾。那么接下来的问题会是,只要有幻觉存在,AI到底是否可以成为知识停止点系统?我持怀疑态度。幻觉是“内生于大模型”的。从这个意义来说,我也不是说就不能用人工智能作为知识来源,而是认为,这对于人的AI素养以及相关能力要求是非常高的,关键在于是否能识别幻觉的根本性。因此,我们必须要在使用人工智能时,养成“人在回路中”的使用习惯。最重要的是,使用人工智能需要有一个前提条件:TA必须是一个具备超高信息素养的人。
AI时代更需要“无分数学习”人工智能的出现,的确给整个社会系统特别是教育系统带来了非常多的冲击和不确定性。现在的考试很多时候其实都是大模型在应试,学生用这些人工智能工具来完成作业和论文,教授们也在使用人工智能来写论文或者做项目,很难去遏制这种趋势的发生。事实上,我们必须思考应在何种程度上延续以往的教育。
我想把这个思考落实到绩点上。在我们中国,凡是受教育的人,都很熟悉的一句顺口溜就是:“考考考,老师的法宝;分分分,学生的命根。”学生们在接受教育的过程中会认为,考试和分数都是天经地义的。正因如此,我们其实没有想过到底什么是分数,以及去追根溯源它的成因。而现在,人工智能正在挑战我们很多习以为常的一些事情,它也带来了一个好处;打破了一些过去的认知体系。
譬如,分数到底是干什么的?从老师角度来讲,分数是教师评估和报告学生表现的一种方式。这种制度从学生的小学到研究生再到就业,都是在用一个看似精确的分数来表达这个学生的学业表现。一旦这些成绩被记录下来,往往会对一个人的人生产生长期而深远的影响。家长为孩子的分数时刻焦虑,成绩就变成了“指挥棒”,指挥一切。
究其源流,进入现代社会以后,需要一种量化的手段和对学生分类的机制,因此分数本质上是个现代性的制度。而这个现代性制度的背后,就是因为教育普及后产生的现代生产机制,需要大量的合格劳工来支持。因此,大众的教育就一定会被官僚化,不然就没有办法评判一个人。长此以往,这个机制就催生了普遍性的分数系统。但这个系统是很难反馈出学生的真实水平的。这个过程中,我们很容易舍本逐末,到底是学生真正掌握了相关知识而获得好成绩,还是仅仅是因为刷题刷得好获得好成绩,这个事情是有待考究的。
人工智能时代到来之后,应该设想一个概念,叫做“无分数学习”。我希望我们可以把评分体系或者说成绩体系,置换到更具有挑战性的学习任务,并且让学生的注意力回归到更有意义的事情上面。
今天的教育需要思考构建一种全新的评估体系。在21世纪,还要继续用分数来衡量一个学生吗?还是可以探索一种不依赖分数,却能有效表达知识、促进交流的方式?这样的体系肯定不容易建立,但我认为有必要去做。不仅是大学,而是整个教育系统都应该朝这个方向改革。在生成式AI的时代,我们要用新的系统,去取代过去那套建立在现代性评估标准和大学录取标准之上的旧体系。这个新体系还必须能够与社会接轨,因为雇主仍然需要区分和评估不同的学生。从雇主的角度来说,越来越倾向于看应聘的人会不会使用人工智能工具,但其实工具并不重要,而是要看使用工具的那个人是怎么样的。也就是说,你是不是一个善于运用人工智能来进行优秀的沟通,或者善于用人工智能来进行深度的思考和创新的复合型人才?当你深度思考之后再用人工智能去创新,其实核心不是单纯掌握工具的能力。最简单的层面,比如用AI来制作内容,这背后考验的其实是综合能力:沟通、写作、批判性思维、创造力,甚至个人特质,比如自信心。
我们现在的小孩都是从“内容为王”的教育系统中教育出来的。我们学基础内容都学得很好,但解决问题的能力就相对较差。那么我们的教育体系应该培养什么能力?我觉得是会用人工智能工具或者任何工具能够生产出东西的能力。再往上是沟通协作、批判性思维、创造力,还有自信心,这些是在人工智能时代所需要的关键技能,也是跟以往标准成绩单有所不同的地方。我们应该创造一个服务于学生的成长和发展的新系统,而这个新的系统背后也不仅仅是评分本身,而是归结于学习的价值和评价的正义性。
“文科有用”:人文通识教育变得前所未有的重要我始终认为人类的某些智能,是机器目前无法获得、也无法取代的。这些能力是让我们成为“人”的关键部分。为了让这些能力更好地发展,我们必须推广和提升更注重智慧、创造力与人文关怀的教育。在这个意义上,我认为AI时代,人文学科的作用会变得更加重要。
我的核心观点有两点:第一,要做到“人的归人,机器的归机器”,不要混淆两者的边界。第二,我们不该只问“人工智能能为人类做什么”,还要问“人工智能正在对人类做什么”。AI对我们已经造成了许多影响,而应对这些影响的办法,是让人变得更有人性,更加努力地去发挥那些机器目前无法实现的能力,比如创造力、批判性思维和直觉。
机器和我们人类的创造力是完全不能等同的。现在的人工智能非常擅长干出产内容这种事,不管是写东西还是艺术创作,但它的写作也被批判为没有灵魂。这就产生两个问题,第一个是多样性的问题。所谓的千篇一律,是我们语言和表达方式的多样性在下降。第二个,如果我们不讨论多样性,单纯讨论创造力,我们会意识到说,如果有一个类似于具备“百科全书”般能力的机器来帮你产生创意,那么的确会比在单独思考的时候产生更多创意。
在个体层面上,人工智能是可以帮助个体拓展想象空间的。然而在群体层面,当前生成式系统所产生的创意本质上是源于单一模型框架来发展的。这种单一性源于训练数据分布与概率引导的机制,并且它非常善于排列组合。然而,关于此类系统是否能够产生具有颠覆性的范式创新想法,目前仍是一个尚未明确的问题。当然关于这一点也见仁见智,可能有的人会认为它有很多创新想法,那么我们需要讨论的就是在何等层级上界定何为颠覆性范式创新。
在颠覆性范式上,我认为我们需要讨论的层级是“行星层级”的问题。比如说,全球气球变化造成的问题,经济的不平等或者说迄今为止人类还无法消除的暴力。我不觉得人工智能可以在这些层面产生颠覆性范式的创新想法。如果我们用行星层级的创造力来衡量它,我觉得人工智能是做不到的。因此,我倾向于相信我们仍然需要一种更好的、可以提升人性的教育。我觉得越到这个时候,越需要去强调通识教育的重要性。
人工智能给我们带来很多东西是硬技能,而通识教育培育的是软技能。我也意识到,很多人现在用人工智能来写作。如果人们用它来写散文或者小说,会发现它写的散文或者小说是非常程式化的。人工智能缺少的,是作为一个“人”真正的激情和痛苦。生活中有深刻的个人体验,而这些体验其实是人类创作深刻作品的基础。如果没有了人文社科,那么就会暴露两点:第一是,人们会马上发现目前人工智能还不能做到的事,例如揭示痛苦。第二,我们并不能发现我们自己到底是谁,也就无法与人工智能相处了。