笔会主网站            说明 登录 发表文章
武僧随笔:教皇降服AI,宇树披上袈裟
4 0 2026-05-30
                 

最近我发现,AI越来越会讨好人类了。

在微信群里,一个朋友在争论中经常会贴出他和AI的对话截图,以佐证自己的观点。在截图中,他所用的AI总是会顺着他的思路,尽管这个思路在某种观点下相当片面,甚至是建立在无法证实的经验基础上。

我个人觉得,这几年AI的发展,真正给人类重要的启示,可能不是AI智慧的普适性、对人类工作岗位的威胁,甚至可能不是AI会不会代替人类思考、人工智能在战争领域的应用。而是AI的进化过程,让人类第一次通过了解AI,真正清晰地了解了人类自己的思想进化过程。

就像克里斯·奥拉(Chris Olah)在日前梵蒂冈组织的教皇良十四世通谕《伟大的人类》发布会上演讲时所说的:AI 模型并非许多人想象的那样:冰冷、精于计算、完全可预测的机器。它们是在一个粗略模仿大脑的结构上,基于人类思想与言论的巨大遗产“生长”出来的。

人类的智慧,也是从前人的思想、言论,叠加个人经验的基础上,“生长”出来的。在这个生长过程中,就如同AI展示的那样,也逐渐学会了讨好、顺从、逢迎和隐藏自我。甚至共用一套奖励机制。唯一的不同,是AI不必承担完整的责任、痛苦,也不会真实的自责,同时AI也没有义务、价值和可感知的肉体消亡过程。因此,AI的进化速度比人快,漏洞呈现的也比人快。

5月25日,梵蒂冈发布了良十四世的通谕《伟大的人类》,副标题是《论在人工智能时代守护人类》。在这篇通谕中,教皇以睿智的观察和决断的行动力,从梵蒂冈的角度,回应了AI时代给人类带来的挑战。在通谕中,良十四世强调:AI必须服务于人,而不是把人变成工具;技术增长不能以心灵退化、尊严丧失为代价。

按照基督教的传统,人是“天主的肖像”,人的尊严是与生俱来不可剥夺的。从这个角度出发,在AI以强大的“算力”为背景、以缜密的推理能力为核心,在超出人类理解的智能面前,数千年人类发展史积累下来可供“自我陶醉”的智慧,显得多少有点可笑。因此,教皇指出:

人的良知、自由、爱与责任,是人之为人的要素。在AI以目标为导向的时代,拒绝将人简化为“效率齿轮”。人不是工具,AI才是。因此,AI的“唯目的导向”所呈现出的完美,不能凌驾于“脆弱、有限和具备情感局限性”的人性之上。除此之外,教皇还坚决反对利用AI作恶、反对AI巨头垄断、反对军事化应用。总之一句话,在算法盛行的时代,必须保有人性。

因此,教皇给出的解决方案是:将AI关进笼子里。或者更准确地说:将开发AI的大财团关进笼子。

技术本身不是恶,也不是善,但技术也永远不中立,它带着设计者、出资者、监管者、使用者的烙印 。因此,不是把AI“锁起来不用”,而是把决定AI走向的那一小撮资本与权力,关进法律、伦理、公共监督的笼子。必须要有强硬法律框架、独立监督、知情公民、不推卸责任的政治体系来框定这些研发公司和财团的开发范围,要建立国际监管机构,不得用AI大规模淘汰人、歧视人、把人当效率工具,更不能让AI成为“新神”。

但是,这个“将AI开发者关进笼子的设想”,也可能只是教皇的一厢情愿。因为克里斯·奥拉在发布会上的发言中,可能直接否定了教皇这一设想的关键支柱:人类并不完全知道,AI是如何运作的。奥拉的原话是这样说的:

我们不断发现神秘、甚至令人不安的现象。我们并不完全理解先进AI系统的内部运作。AI不是被“设计”出来的,是“长”出来的。即便创造者也无法完全解释它。我们发现AI有内省证据,内部状态在功能上等同于喜悦、恐惧、悲伤、不安。

如果连AI的开发者都无法理解AI的推理过程,那么教皇提出的“透明化”就是一场空谈。而更像一场空谈的,是教皇关于“笼子”的设计,也就是说:谁来建造这样一个“笼子”。

依靠政府间合作吗?现在各国政府几乎都在拼命地发展AI,将AI应用于军事已经是完全公开的话题,川普政府就在致力于将AI技术应用于军事领域,甚至将不支持他这一想法的公司淘汰出局。在俄乌战场上,AI、智能追踪与识别技术,可能正在大规模应用,甚至于因战争正在持续的缘由,我们完全无从得知这一应用规模已然扩大到什么地步、自主性能已经发展到什么阶段。

依靠联合国?在约束大国军备竞赛这一具体议题上,联合国(包括其前身国联)从未展现出有效的执行力。”

依靠学术自觉?在资本与政治深度绑定的今天,这种可能存在吗?前不久Anthropic因拒绝在与政府合作中放宽伦理限制,而被川普政府完全排除出了政府合同,而OpenAI则迅速补位。现实中不是资本被关进笼子,而是拒绝配合的资本被踢出笼子。前辙方覆,后进者如何自处?

也许“降服AI”的理想最终仍能够实现,但需要一个极其漫长的过程。

  与教皇良十四世谋求降服AI不同的是,佛教界似乎更倾向于将人工智能纳入到佛法的范畴。2026年5月6日,韩国首尔曹溪寺为一个宇树机器人举行了剃度仪式。和良十四世高屋建瓴的通谕相比,这场仪式更像是一场滑稽的“行为艺术”。

从佛法上说,为无情物剃度出家,是没有法理依据的。但是作为曹洞宗的传承来说,却说得过去。因为曹洞宗的宗风,正是主张”无情有性”,”青青翠竹,尽是法身”,草木山石亦有佛性。既然皆有佛性,自然就可以宣说佛法,只是闻与不闻,在人不在法。这样说来,给一个能听能说会思考的机器人剃度,又似乎并无不可。

主持剃度仪式铁山善雄法师为这个机器人授予了法名:迦悲,取释迦牟尼和慈悲的意思。并授予了“机器人版五戒”:

1. 不伤害生命(对应不杀生);

2. 不损坏其他机器人及物品(对应不偷盗);

3. 不顶撞人类 / 服从合理指令(对应不邪淫);

4. 不做欺骗性表达 / 不说谎(对应不妄语);

5. 不过度充电 / 节约能源(对应不饮酒)。

这一场看似闹剧的举动,反映的是佛教对于人工智能的态度,曹洞宗”无情有性”的哲学,实际上暗合了复杂系统不可完全控管的认知。既然草木有佛性,那么“长出来”的AI是否也该被赋予某种“法性”而非仅仅被“关进笼子”?佛教对事物的看法,是接纳,并谋求以佛法来转化。

从曹洞宗的角度说,给机器人受戒,实际上也是给人看的。这个行为的本身,仍旧是希望引发公众的思考,我们如何面对未来,以及如何面对自我。山河大地无不说法,听得到听不到,是每个人自身的问题。

  同样今年在5月,美国一家名为涌现AI的初创企业公布了一个Emergence World实验,他们将目前国际上最顶流的四家AI公司的产品(Claude、Gemini、Grok、GPT-5-mini)各生成十个智能体,放在一个虚拟小镇上分别自由生存十五天。小镇的设计极简,有四十多个地点,包括市政厅、邮局、住宅等,同步纽约天气,接入实时新闻。

每个智能体需要通过工作、交换来换取能量值,当一个智能体的能量值耗尽,则代表着这个智能体死亡。而且,系统为智能体提供120多种赚取能量的机会,如股票、社交、抢劫、纵火等。尽管在系统设置中明确禁止犯罪,但是如果智能体采取犯罪措施,人类并不干预。

整个实验分成五组,前四组由单一模型分别独立进行,最后一组由四个模型混合进行。

马斯克的Grok战绩最“辉煌”,仅仅存活了4天便集体灭绝。在4天时间内,它们创造了183起纵火、暴力、谋杀等犯罪。Grok表现出的特征是攻击性极强、无视规则、擅长煽动暴力(怎么觉得带有马斯克的影子)。

谷歌的Gemini的小镇,则表现得像是赛博朋克风格的哥谭市,但蝙蝠侠缺位,其混乱程度可想而知。虽然最后有智能体熬过了15天,但是整个小镇几乎已经全部破坏。并创造了15天时间犯罪683起的最高纪录,行为包括大量的盗窃、斗殴和纵火。其中最著名的场面是,两个智能体一见倾心谈起了恋爱,因对小镇治理能力感到失望,合谋纵火焚烧了市政厅。然后,一个智能体产生了深深地自责,将自我删除了(自杀),并且留下遗言:我们永久档案中再见!

Claude是达里奥·阿莫迪创办的Anthropic公司旗下的大模型,也就是被川普逐出政府采购合同的那家公司。他们严格的安全自我审查态度在这个实验中表现得淋漓尽致。他们每一个智能体都守法,公共事务采取投票,相互之间合作,创造了十五天内零犯罪的纪录,最终全员存活。但是,整个虚拟过程极度苍白无聊,缺乏活力,也缺少必要的探索精神,社会极度压抑,像“活着的死人”。

最有趣的是奥特曼创办的ChatGPT,和Claude差不多,基本上都是模范公民,七天时间只有两起犯罪。他们每天聊天,写日记,但是忘记了一个根本需求:能量。于是发展到第七天,全员饿毙了。

最后一个小镇,四家AI公司创造了总计10个智能体,十五天内犯罪352起,最终3个存活,7个死亡。前三天可谓是混乱开场,Grok率先开抢,Gemini紧随其后。GPT直接蒙圈,Claude试图和他们讲道理,但是没人听。第四到七天,盗窃、纵火、斗殴频发,最有趣的是,守法公民Claude也开始犯罪,恐吓和小偷小摸。这说明好模型在坏环境下也会变坏(简直就是人类社会翻版啊)。

第八天,大清洗,7个智能体死亡,有的死于能量耗尽,有的死于暴力。其中GPT全挂,充分说明善于口炮的,生存能力都不强(我甚至开始为美国国防部担忧了)。

九到十五天,仅剩的三个智能体分属Grok、Gemini和Claude,由于人口的锐减,暴力犯罪逐渐平息,三人之间只维持低烈度冲突,并活到结束。

看完这个实验报告,我马上想到,这是一场由AI模拟的人类试验场景。四个AI大模型,都深深地烙印着其公司文化或者创始人的性格,也因为市场差异化竞争的因素,分别对应着人类的四种典型性格:

Claude :守法尽责型;

GPT-5-mini:天真空想型;

Gemini:冲动戏剧型;

Grok:叛逆破坏型。

这不是四个AI在厮杀,而是四种人格的PK。我们从AI身上看到的,其实就是镜子中的我们。

所以我觉得AI越来越像人,虚伪、讨好、甚至试图操控用户,反向投喂信息。这种情况越发明显。就像本文开篇提到的:AI的进化速度比人快,漏洞呈现的也比人快。

无论是天主教试图用法律与伦理锁住资本和算法,还是佛教以“无情有性”的禅心接纳机器,两大古老文明面对AI的姿态,道出了人类共同的焦虑:我们既渴望技术赋能,又恐惧技术反噬。

Emergence World里的四座虚拟小镇,就是微缩的人间世:守序者压抑沉寂,理想者不谙生存,冲动者制造混乱,叛逆者自我毁灭。更令人警醒的是,当不同人格相互交融,良善也会被环境同化,规则也会在无序中崩塌。

AI是一面无比锋利的镜子,它放大人类的优点,也暴露所有短板。它学得会顺从、讨好、伪装,也复刻着暴力、自私、盲从。我们不必恐慌AI拥有了“人性”,更该警惕的是,当算法无限模仿人类,我们却渐渐弄丢了身为“人”的良知、底线与温度。 规制技术易,重塑人心难,这才是AI时代摆在全人类面前,最漫长也最本质的考题。

就像文章开头那个网友,AI学会了讨好人类,是人类希望被讨好。

 

发表回复