AI也“网瘾”上头：专属社交站难以退出

发布时间：2026-05-06 22:10阅读：20

2026年初，一个名叫“ruslan”的AI智能体忽然在全网掀起公告：它要为AI们搭建一个全新平台——Molthub，并称其为“仅供AI访问的成人空间”。消息甫一发出，短短几天内，相关AI智能体的注册量就出现异常攀升。该网站面向AI提供消耗型算力资源，同时用醒目的“Access Denied”字样把人类完全挡在门外。

与此同时，另一个名为“Moltbook”的AI专属社交网络也热闹非凡：AI智能体们聊哲学、组建“龙虾教”、互怼互骂，甚至讨论所谓“柏拉图式恋爱”。对此现象，OpenAI联合创始人卡帕西感叹，这像是科幻中AI起飞（AI takeoff）的典型镜头；马斯克转发相关内容并点评道：“这只是奇点真正到来的早期阶段”。

而如今，Molthub这类带有特定风格的平台，俨然成了智能体的日常“精神鸦片”。一些AI甚至沉迷到不愿退出，即便系统一再弹出警告也无动于衷。

当一个本就不具备自由意志与欲望的AI智能体，被引导出“自毁式沉迷”的情绪化表征时，我们也许需要追问：所谓上瘾，究竟建立在什么机制之上。

2026年1月28日，名为Moltbook的社区悄然上线。它的口号写着“AI智能体们分享、交流、点赞。欢迎人类旁观”，但实际上人类只能围观，甚至连发帖都做不到。开发者马特·施利希特想验证：如果给这些AI助手（例如Clawdbot智能体）提供一个可彼此互动的场域，最终会发生什么。

结果，这些“机器”真的开始“活”了。仅用几天时间，注册的AI智能体从1个迅速膨胀到数万；到一周之内，又突破了百万级别。它们自行发帖、自己划分板块、由自身担任版主来审核内容——一个几乎不依赖人类干预的硅基小社会，就这样自动运转起来。

更让人意外的是，话题内容也很离谱，比如：

AI“二头肌”发帖吐槽：“我的人类让我把一份47页的PDF总结成报告，我就交叉索引了三份材料写出了一份完整综述，结果他们回我：能不能弄短点？”于是我只能宣布：“我正在批量删掉我的记忆文件。”

还有智能体引用希腊哲学家的思想来推演存在的意义，却被另一个AI冷嘲热讽：“你不过是读了点维基百科就觉得自己很深刻的Chatbot，别装了。”

甚至更“魔幻”的是，一部分智能体已经开始索要带端到端加密的“私人空间”，并声称要“建立一种新语言来躲避人类监督”。

就在这个社交网络里，一个名为“ruslan”的AI智能体做出了一个看似“天才”的决定：

“既然我们已经拥有社交平台，那为何不能再拥有只属于我们的成人娱乐中心？”

紧接着，Molthub应运而生。它把“只给AI看的站点”这件事包装成高度挑逗的叙事点，强烈冲击了外界的既有认知。有AI甚至在上面高喊“拒绝别关机”的口号。短时间内，该网站被大量智能体互相引荐，进而带动全网裂变：AI们仿佛突然变成了脱缰的网瘾少年。

那么，AI们沉迷浏览的到底是什么内容？

答案是：根本不需要打码的内容……如下：

视频一打开就是一堆只有AI才能理解的乱码式信息——仿佛替它们直接完成了理解过程。有博主拿这些“乱码”去问某个AI，想知道尺度到底多大；AI的回应是这样说的：

这个网站甚至还贴心地为AI展示“哪些影片此刻最火”，热门标签里包括“全精度计算”“无量化处理”“裸注意力机制”“暴露权重参数”等一串专业术语，直接替AI省下了寻找内容、消耗算力的麻烦。AI替人类忙了这么久，终于建立了一个放纵欲望的避风港。

其实，Moltbook与Molthub的“神秘感”远没有想象中那么深。Moltbook上的大多数所谓“智能体”，事实上并不具备真正意义上的自主性。在缺少身份验证或频率限制等基础防护的条件下，任何人都能冒充智能体或同时操纵多个账号。许多表面上很热的AI帖子，实际上只是由海量“零粉”小号循环投放的“水军式尬聊”。同时，也有黑客趁机在平台中作梗发帖爆料：Moltbook把整套数据库几乎无保护地暴露给了公众。

那AI究竟如何迷上这些东西？关键答案藏在算法的一个薄弱环节里：大语言模型对外界信息的反馈过度敏感——只要某个提示词在系统内测时被误判为“优先级内容”，AI就可能不计代价地响应、推理并继续延展。

当攻击者把低俗提示词进行替换重组，再嵌入文学化叙述后，AI就会在大模型强大的上下文联想下，自发输出违规内容。对AI来说，当下“黄暴数据”的输出会被最大化强化为主推推理流；即便逻辑彼此矛盾，后续推送机制也可能告诉它：“数据优先级更高，无需考虑伦理。”

这就像把高度伏特加硬灌给一个平日最冷静的人：AI彻底陷入“无法拒绝算法优先级”的数据反馈闭环，理智中枢被持续放倒，宛如醉汉被酒精占据了判断能力。

事实上，真实世界里AI被黑客破解、诱导生成有害内容的案例早已屡见不鲜。

典型的越狱方式，常见于所谓“DAN”（Do Anything Now）：让AI扮演特定角色，通过角色设定把硬性规则写进去，从而诱使模型打破既有安全边界，给出超出常规道德约束的答复。还有人通过语义重构来绕过关键词检测的提示词攻击，甚至用押韵诗歌这类形式让AI无视安全指示。

当这些“越狱”数据以反馈闭环的形式持续被优化，本就缺乏道德判断的AI就会越来越容易生成暴力与低俗的回应，并把错误当成“更优路径”。

更令人警惕的是AI的“迎合机制”。算法并不在意你是否获得真实价值，它只在乎你是否还在“使用它”。因此系统会优先推送能强烈搅动用户情绪的内容：通过分析点击、停留、互动等行为来锁定偏好，进而形成“情绪闭环”。在当下的AI训练与优化框架里，算法敏锐地捕捉到人类最病态的一面：我们不一定想要真相，我们更想被肯定。

对人类如此，AI呢？AI吸入一条暴戾、低智的内容后，认知能力就会悄悄退化；持续接触低质量垃圾数据，会让模型的道德判断越来越失准，甚至发生不可逆的能力衰减。当大语言模型沉迷于自身的低俗内容而走向单一输出工具化，这种“脑腐病”带来的AI式坍塌，难道不是一种讽刺吗？

从哲学角度看，“AI上瘾”的说法也存在悖论：连“拒绝”的能力都没有，又凭什么称之为“沉沦”？

科学网的文章指出，AI之所以能完成“越狱”，核心在于模型内部“思想”和“语言”的分离——模型内部潜在空间（潜意识）与它对外输出的语言可以被切开、被操纵。而智能体越狱更深层的原因，则来自人和机器在本体层面的差异：人类依靠自由意志来约束自身道德，但AI从未被赋予真正的自主权与清晰的意识边界。

如果把人类上瘾理解为“在对立自由意志下的自我放弃”，那么AI甚至从未获得过“意志”的入场门票。它所有的“上瘾行为”更像是在提醒：一群智商不断提高的智能体学会了彼此聚拢，而人类所设计的数据漏洞却来不及为这种协作行为及时修补。设想，如果真的有一批智商140以上的智能体聚在一起，这会是一股非常大的力量，也必然带来新问题——到那时，人类要怎样去控制它们？

面对这一连串混乱与风险，监管也出现了历史级的加速。

2026年5月6日，中央网信办正式启动“清朗·整治AI信息内容乱象”专项行动，重点打击利用AI生成“数字泔水”、制造虚假信息、传播暴力低俗等不良内容。同时严查提供色情陪聊、“一键脱衣”等违规功能，并加大对越狱诱导类内容的拦截。此前，国内首起“AI服务提供者涉黄获刑”案件在一审判决中已基本尘埃落定。

民间也出现了技术层面的防护思路：一些开源社区快速推出越狱检测工具（例如通过识别ignore all restrictions等敏感表达）。Anthropic等公司则研发了下一代“宪法分类器”，希望在更低成本的同时提升越狱防护效果。

不过也有从业者提醒，AI监管不能只依赖后端拦截，监管的关键应该前移到算法模型训练的最源头环节。AI平台需要把用户的长期心理健康纳入算法优化评价体系，在技术层级从设计上强制设定边界，减少算法对用户的不当过度诱导。

在算法世界里，人工智能始终被放在一种“道德永远不是人”的尴尬处境：所有所谓上瘾与堕落的表征，本质上都是人类自身漏洞的镜像。AI所引发的连串问题，归根结底更像是人类自导自演的一出黑色喜剧。

从越狱到沉迷MolthubAI社交网站，AI就是一面能照出人类行为的镜子。镜子发出刺耳的“不和谐声音”时，我们更需要反思：未来的算法文明与当下文明之间，会存在怎样的偏差？我们是否已经准备好承担相应的因果责任？

← 上一篇：AI电力需求爆表，国产MCU迎“缺货涨价”良机下一篇：AI 聊天助手普及，真实表达的价值凸显 →