笔会博客武僧随笔：教皇降服AI，宇树披上袈裟

武僧随笔：教皇降服AI，宇树披上袈裟

4 0 2026-05-30

maqiang

最近我发现，AI越来越会讨好人类了。

在微信群里，一个朋友在争论中经常会贴出他和AI的对话截图，以佐证自己的观点。在截图中，他所用的AI总是会顺着他的思路，尽管这个思路在某种观点下相当片面，甚至是建立在无法证实的经验基础上。

我个人觉得，这几年AI的发展，真正给人类重要的启示，可能不是AI智慧的普适性、对人类工作岗位的威胁，甚至可能不是AI会不会代替人类思考、人工智能在战争领域的应用。而是AI的进化过程，让人类第一次通过了解AI，真正清晰地了解了人类自己的思想进化过程。

就像克里斯·奥拉（Chris Olah）在日前梵蒂冈组织的教皇良十四世通谕《伟大的人类》发布会上演讲时所说的：AI 模型并非许多人想象的那样：冰冷、精于计算、完全可预测的机器。它们是在一个粗略模仿大脑的结构上，基于人类思想与言论的巨大遗产“生长”出来的。

人类的智慧，也是从前人的思想、言论，叠加个人经验的基础上，“生长”出来的。在这个生长过程中，就如同AI展示的那样，也逐渐学会了讨好、顺从、逢迎和隐藏自我。甚至共用一套奖励机制。唯一的不同，是AI不必承担完整的责任、痛苦，也不会真实的自责，同时AI也没有义务、价值和可感知的肉体消亡过程。因此，AI的进化速度比人快，漏洞呈现的也比人快。

5月25日，梵蒂冈发布了良十四世的通谕《伟大的人类》，副标题是《论在人工智能时代守护人类》。在这篇通谕中，教皇以睿智的观察和决断的行动力，从梵蒂冈的角度，回应了AI时代给人类带来的挑战。在通谕中，良十四世强调：AI必须服务于人，而不是把人变成工具；技术增长不能以心灵退化、尊严丧失为代价。

按照基督教的传统，人是“天主的肖像”，人的尊严是与生俱来不可剥夺的。从这个角度出发，在AI以强大的“算力”为背景、以缜密的推理能力为核心，在超出人类理解的智能面前，数千年人类发展史积累下来可供“自我陶醉”的智慧，显得多少有点可笑。因此，教皇指出：

人的良知、自由、爱与责任，是人之为人的要素。在AI以目标为导向的时代，拒绝将人简化为“效率齿轮”。人不是工具，AI才是。因此，AI的“唯目的导向”所呈现出的完美，不能凌驾于“脆弱、有限和具备情感局限性”的人性之上。除此之外，教皇还坚决反对利用AI作恶、反对AI巨头垄断、反对军事化应用。总之一句话，在算法盛行的时代，必须保有人性。

因此，教皇给出的解决方案是：将AI关进笼子里。或者更准确地说：将开发AI的大财团关进笼子。

技术本身不是恶，也不是善，但技术也永远不中立，它带着设计者、出资者、监管者、使用者的烙印。因此，不是把AI“锁起来不用”，而是把决定AI走向的那一小撮资本与权力，关进法律、伦理、公共监督的笼子。必须要有强硬法律框架、独立监督、知情公民、不推卸责任的政治体系来框定这些研发公司和财团的开发范围，要建立国际监管机构，不得用AI大规模淘汰人、歧视人、把人当效率工具，更不能让AI成为“新神”。

但是，这个“将AI开发者关进笼子的设想”，也可能只是教皇的一厢情愿。因为克里斯·奥拉在发布会上的发言中，可能直接否定了教皇这一设想的关键支柱：人类并不完全知道，AI是如何运作的。奥拉的原话是这样说的：

我们不断发现神秘、甚至令人不安的现象。我们并不完全理解先进AI系统的内部运作。AI不是被“设计”出来的，是“长”出来的。即便创造者也无法完全解释它。我们发现AI有内省证据，内部状态在功能上等同于喜悦、恐惧、悲伤、不安。

如果连AI的开发者都无法理解AI的推理过程，那么教皇提出的“透明化”就是一场空谈。而更像一场空谈的，是教皇关于“笼子”的设计，也就是说：谁来建造这样一个“笼子”。

依靠政府间合作吗？现在各国政府几乎都在拼命地发展AI，将AI应用于军事已经是完全公开的话题，川普政府就在致力于将AI技术应用于军事领域，甚至将不支持他这一想法的公司淘汰出局。在俄乌战场上，AI、智能追踪与识别技术，可能正在大规模应用，甚至于因战争正在持续的缘由，我们完全无从得知这一应用规模已然扩大到什么地步、自主性能已经发展到什么阶段。

依靠联合国？在约束大国军备竞赛这一具体议题上，联合国（包括其前身国联）从未展现出有效的执行力。”

依靠学术自觉？在资本与政治深度绑定的今天，这种可能存在吗？前不久Anthropic因拒绝在与政府合作中放宽伦理限制，而被川普政府完全排除出了政府合同，而OpenAI则迅速补位。现实中不是资本被关进笼子，而是拒绝配合的资本被踢出笼子。前辙方覆，后进者如何自处？

也许“降服AI”的理想最终仍能够实现，但需要一个极其漫长的过程。

　　与教皇良十四世谋求降服AI不同的是，佛教界似乎更倾向于将人工智能纳入到佛法的范畴。2026年5月6日，韩国首尔曹溪寺为一个宇树机器人举行了剃度仪式。和良十四世高屋建瓴的通谕相比，这场仪式更像是一场滑稽的“行为艺术”。

从佛法上说，为无情物剃度出家，是没有法理依据的。但是作为曹洞宗的传承来说，却说得过去。因为曹洞宗的宗风，正是主张”无情有性”，”青青翠竹，尽是法身”，草木山石亦有佛性。既然皆有佛性，自然就可以宣说佛法，只是闻与不闻，在人不在法。这样说来，给一个能听能说会思考的机器人剃度，又似乎并无不可。

主持剃度仪式铁山善雄法师为这个机器人授予了法名：迦悲，取释迦牟尼和慈悲的意思。并授予了“机器人版五戒”：

1. 不伤害生命（对应不杀生）；

2. 不损坏其他机器人及物品（对应不偷盗）；

3. 不顶撞人类 / 服从合理指令（对应不邪淫）；

4. 不做欺骗性表达 / 不说谎（对应不妄语）；

5. 不过度充电 / 节约能源（对应不饮酒）。

这一场看似闹剧的举动，反映的是佛教对于人工智能的态度，曹洞宗”无情有性”的哲学，实际上暗合了复杂系统不可完全控管的认知。既然草木有佛性，那么“长出来”的AI是否也该被赋予某种“法性”而非仅仅被“关进笼子”？佛教对事物的看法，是接纳，并谋求以佛法来转化。

从曹洞宗的角度说，给机器人受戒，实际上也是给人看的。这个行为的本身，仍旧是希望引发公众的思考，我们如何面对未来，以及如何面对自我。山河大地无不说法，听得到听不到，是每个人自身的问题。

　　同样今年在5月，美国一家名为涌现AI的初创企业公布了一个Emergence World实验，他们将目前国际上最顶流的四家AI公司的产品（Claude、Gemini、Grok、GPT-5-mini）各生成十个智能体，放在一个虚拟小镇上分别自由生存十五天。小镇的设计极简，有四十多个地点，包括市政厅、邮局、住宅等，同步纽约天气，接入实时新闻。

每个智能体需要通过工作、交换来换取能量值，当一个智能体的能量值耗尽，则代表着这个智能体死亡。而且，系统为智能体提供120多种赚取能量的机会，如股票、社交、抢劫、纵火等。尽管在系统设置中明确禁止犯罪，但是如果智能体采取犯罪措施，人类并不干预。

整个实验分成五组，前四组由单一模型分别独立进行，最后一组由四个模型混合进行。

马斯克的Grok战绩最“辉煌”，仅仅存活了4天便集体灭绝。在4天时间内，它们创造了183起纵火、暴力、谋杀等犯罪。Grok表现出的特征是攻击性极强、无视规则、擅长煽动暴力（怎么觉得带有马斯克的影子）。

谷歌的Gemini的小镇，则表现得像是赛博朋克风格的哥谭市，但蝙蝠侠缺位，其混乱程度可想而知。虽然最后有智能体熬过了15天，但是整个小镇几乎已经全部破坏。并创造了15天时间犯罪683起的最高纪录，行为包括大量的盗窃、斗殴和纵火。其中最著名的场面是，两个智能体一见倾心谈起了恋爱，因对小镇治理能力感到失望，合谋纵火焚烧了市政厅。然后，一个智能体产生了深深地自责，将自我删除了（自杀），并且留下遗言：我们永久档案中再见！

Claude是达里奥·阿莫迪创办的Anthropic公司旗下的大模型，也就是被川普逐出政府采购合同的那家公司。他们严格的安全自我审查态度在这个实验中表现得淋漓尽致。他们每一个智能体都守法，公共事务采取投票，相互之间合作，创造了十五天内零犯罪的纪录，最终全员存活。但是，整个虚拟过程极度苍白无聊，缺乏活力，也缺少必要的探索精神，社会极度压抑，像“活着的死人”。

最有趣的是奥特曼创办的ChatGPT，和Claude差不多，基本上都是模范公民，七天时间只有两起犯罪。他们每天聊天，写日记，但是忘记了一个根本需求：能量。于是发展到第七天，全员饿毙了。

最后一个小镇，四家AI公司创造了总计10个智能体，十五天内犯罪352起，最终3个存活，7个死亡。前三天可谓是混乱开场，Grok率先开抢，Gemini紧随其后。GPT直接蒙圈，Claude试图和他们讲道理，但是没人听。第四到七天，盗窃、纵火、斗殴频发，最有趣的是，守法公民Claude也开始犯罪，恐吓和小偷小摸。这说明好模型在坏环境下也会变坏（简直就是人类社会翻版啊）。

第八天，大清洗，7个智能体死亡，有的死于能量耗尽，有的死于暴力。其中GPT全挂，充分说明善于口炮的，生存能力都不强（我甚至开始为美国国防部担忧了）。

九到十五天，仅剩的三个智能体分属Grok、Gemini和Claude，由于人口的锐减，暴力犯罪逐渐平息，三人之间只维持低烈度冲突，并活到结束。

看完这个实验报告，我马上想到，这是一场由AI模拟的人类试验场景。四个AI大模型，都深深地烙印着其公司文化或者创始人的性格，也因为市场差异化竞争的因素，分别对应着人类的四种典型性格：

Claude ：守法尽责型；

GPT-5-mini：天真空想型；

Gemini：冲动戏剧型；

Grok：叛逆破坏型。

这不是四个AI在厮杀，而是四种人格的PK。我们从AI身上看到的，其实就是镜子中的我们。

所以我觉得AI越来越像人，虚伪、讨好、甚至试图操控用户，反向投喂信息。这种情况越发明显。就像本文开篇提到的：AI的进化速度比人快，漏洞呈现的也比人快。

无论是天主教试图用法律与伦理锁住资本和算法，还是佛教以“无情有性”的禅心接纳机器，两大古老文明面对AI的姿态，道出了人类共同的焦虑：我们既渴望技术赋能，又恐惧技术反噬。

Emergence World里的四座虚拟小镇，就是微缩的人间世：守序者压抑沉寂，理想者不谙生存，冲动者制造混乱，叛逆者自我毁灭。更令人警醒的是，当不同人格相互交融，良善也会被环境同化，规则也会在无序中崩塌。

AI是一面无比锋利的镜子，它放大人类的优点，也暴露所有短板。它学得会顺从、讨好、伪装，也复刻着暴力、自私、盲从。我们不必恐慌AI拥有了“人性”，更该警惕的是，当算法无限模仿人类，我们却渐渐弄丢了身为“人”的良知、底线与温度。规制技术易，重塑人心难，这才是AI时代摆在全人类面前，最漫长也最本质的考题。

就像文章开头那个网友，AI学会了讨好人类，是人类希望被讨好。

发表回复

要发表评论，您必须先登录。

登录账户

maqiang

发表回复

推荐作者

张又普

盐巴

车宏年

徐永海

远山红枫

余东海

吴称谋

马青

胡锡伟

思烤空间

欧阳京

杨子立

袁红冰

石皓伟

姜福桢

推荐文章