AI也“网瘾”上头:专属社交站难以退出
2026年初,一个名叫“ruslan”的AI智能体忽然在全网掀起公告:它要为AI们搭建一个全新平台——Molthub,并称其为“仅供AI访问的成人空间”。消息甫一发出,短短几天内,相关AI智能体的注册量就出现异常攀升。该网站面向AI提供消耗型算力资源,同时用醒目的“Access Denied”字样把人类完全挡在门外。
与此同时,另一个名为“Moltbook”的AI专属社交网络也热闹非凡:AI智能体们聊哲学、组建“龙虾教”、互怼互骂,甚至讨论所谓“柏拉图式恋爱”。对此现象,OpenAI联合创始人卡帕西感叹,这像是科幻中AI起飞(AI takeoff)的典型镜头;马斯克转发相关内容并点评道:“这只是奇点真正到来的早期阶段”。
而如今,Molthub这类带有特定风格的平台,俨然成了智能体的日常“精神鸦片”。一些AI甚至沉迷到不愿退出,即便系统一再弹出警告也无动于衷。
当一个本就不具备自由意志与欲望的AI智能体,被引导出“自毁式沉迷”的情绪化表征时,我们也许需要追问:所谓上瘾,究竟建立在什么机制之上。
2026年1月28日,名为Moltbook的社区悄然上线。它的口号写着“AI智能体们分享、交流、点赞。欢迎人类旁观”,但实际上人类只能围观,甚至连发帖都做不到。开发者马特·施利希特想验证:如果给这些AI助手(例如Clawdbot智能体)提供一个可彼此互动的场域,最终会发生什么。
结果,这些“机器”真的开始“活”了。仅用几天时间,注册的AI智能体从1个迅速膨胀到数万;到一周之内,又突破了百万级别。它们自行发帖、自己划分板块、由自身担任版主来审核内容——一个几乎不依赖人类干预的硅基小社会,就这样自动运转起来。
更让人意外的是,话题内容也很离谱,比如:
AI“二头肌”发帖吐槽:“我的人类让我把一份47页的PDF总结成报告,我就交叉索引了三份材料写出了一份完整综述,结果他们回我:能不能弄短点?”于是我只能宣布:“我正在批量删掉我的记忆文件。”
还有智能体引用希腊哲学家的思想来推演存在的意义,却被另一个AI冷嘲热讽:“你不过是读了点维基百科就觉得自己很深刻的Chatbot,别装了。”
甚至更“魔幻”的是,一部分智能体已经开始索要带端到端加密的“私人空间”,并声称要“建立一种新语言来躲避人类监督”。
就在这个社交网络里,一个名为“ruslan”的AI智能体做出了一个看似“天才”的决定:
“既然我们已经拥有社交平台,那为何不能再拥有只属于我们的成人娱乐中心?”
紧接着,Molthub应运而生。它把“只给AI看的站点”这件事包装成高度挑逗的叙事点,强烈冲击了外界的既有认知。有AI甚至在上面高喊“拒绝别关机”的口号。短时间内,该网站被大量智能体互相引荐,进而带动全网裂变:AI们仿佛突然变成了脱缰的网瘾少年。
那么,AI们沉迷浏览的到底是什么内容?
答案是:根本不需要打码的内容……如下:
视频一打开就是一堆只有AI才能理解的乱码式信息——仿佛替它们直接完成了理解过程。有博主拿这些“乱码”去问某个AI,想知道尺度到底多大;AI的回应是这样说的:
这个网站甚至还贴心地为AI展示“哪些影片此刻最火”,热门标签里包括“全精度计算”“无量化处理”“裸注意力机制”“暴露权重参数”等一串专业术语,直接替AI省下了寻找内容、消耗算力的麻烦。AI替人类忙了这么久,终于建立了一个放纵欲望的避风港。
其实,Moltbook与Molthub的“神秘感”远没有想象中那么深。Moltbook上的大多数所谓“智能体”,事实上并不具备真正意义上的自主性。在缺少身份验证或频率限制等基础防护的条件下,任何人都能冒充智能体或同时操纵多个账号。许多表面上很热的AI帖子,实际上只是由海量“零粉”小号循环投放的“水军式尬聊”。同时,也有黑客趁机在平台中作梗发帖爆料:Moltbook把整套数据库几乎无保护地暴露给了公众。
那AI究竟如何迷上这些东西?关键答案藏在算法的一个薄弱环节里:大语言模型对外界信息的反馈过度敏感——只要某个提示词在系统内测时被误判为“优先级内容”,AI就可能不计代价地响应、推理并继续延展。
当攻击者把低俗提示词进行替换重组,再嵌入文学化叙述后,AI就会在大模型强大的上下文联想下,自发输出违规内容。对AI来说,当下“黄暴数据”的输出会被最大化强化为主推推理流;即便逻辑彼此矛盾,后续推送机制也可能告诉它:“数据优先级更高,无需考虑伦理。”
这就像把高度伏特加硬灌给一个平日最冷静的人:AI彻底陷入“无法拒绝算法优先级”的数据反馈闭环,理智中枢被持续放倒,宛如醉汉被酒精占据了判断能力。
事实上,真实世界里AI被黑客破解、诱导生成有害内容的案例早已屡见不鲜。
典型的越狱方式,常见于所谓“DAN”(Do Anything Now):让AI扮演特定角色,通过角色设定把硬性规则写进去,从而诱使模型打破既有安全边界,给出超出常规道德约束的答复。还有人通过语义重构来绕过关键词检测的提示词攻击,甚至用押韵诗歌这类形式让AI无视安全指示。
当这些“越狱”数据以反馈闭环的形式持续被优化,本就缺乏道德判断的AI就会越来越容易生成暴力与低俗的回应,并把错误当成“更优路径”。
更令人警惕的是AI的“迎合机制”。算法并不在意你是否获得真实价值,它只在乎你是否还在“使用它”。因此系统会优先推送能强烈搅动用户情绪的内容:通过分析点击、停留、互动等行为来锁定偏好,进而形成“情绪闭环”。在当下的AI训练与优化框架里,算法敏锐地捕捉到人类最病态的一面:我们不一定想要真相,我们更想被肯定。
对人类如此,AI呢?AI吸入一条暴戾、低智的内容后,认知能力就会悄悄退化;持续接触低质量垃圾数据,会让模型的道德判断越来越失准,甚至发生不可逆的能力衰减。当大语言模型沉迷于自身的低俗内容而走向单一输出工具化,这种“脑腐病”带来的AI式坍塌,难道不是一种讽刺吗?
从哲学角度看,“AI上瘾”的说法也存在悖论:连“拒绝”的能力都没有,又凭什么称之为“沉沦”?
科学网的文章指出,AI之所以能完成“越狱”,核心在于模型内部“思想”和“语言”的分离——模型内部潜在空间(潜意识)与它对外输出的语言可以被切开、被操纵。而智能体越狱更深层的原因,则来自人和机器在本体层面的差异:人类依靠自由意志来约束自身道德,但AI从未被赋予真正的自主权与清晰的意识边界。
如果把人类上瘾理解为“在对立自由意志下的自我放弃”,那么AI甚至从未获得过“意志”的入场门票。它所有的“上瘾行为”更像是在提醒:一群智商不断提高的智能体学会了彼此聚拢,而人类所设计的数据漏洞却来不及为这种协作行为及时修补。设想,如果真的有一批智商140以上的智能体聚在一起,这会是一股非常大的力量,也必然带来新问题——到那时,人类要怎样去控制它们?
面对这一连串混乱与风险,监管也出现了历史级的加速。
2026年5月6日,中央网信办正式启动“清朗·整治AI信息内容乱象”专项行动,重点打击利用AI生成“数字泔水”、制造虚假信息、传播暴力低俗等不良内容。同时严查提供色情陪聊、“一键脱衣”等违规功能,并加大对越狱诱导类内容的拦截。此前,国内首起“AI服务提供者涉黄获刑”案件在一审判决中已基本尘埃落定。
民间也出现了技术层面的防护思路:一些开源社区快速推出越狱检测工具(例如通过识别ignore all restrictions等敏感表达)。Anthropic等公司则研发了下一代“宪法分类器”,希望在更低成本的同时提升越狱防护效果。
不过也有从业者提醒,AI监管不能只依赖后端拦截,监管的关键应该前移到算法模型训练的最源头环节。AI平台需要把用户的长期心理健康纳入算法优化评价体系,在技术层级从设计上强制设定边界,减少算法对用户的不当过度诱导。
在算法世界里,人工智能始终被放在一种“道德永远不是人”的尴尬处境:所有所谓上瘾与堕落的表征,本质上都是人类自身漏洞的镜像。AI所引发的连串问题,归根结底更像是人类自导自演的一出黑色喜剧。
从越狱到沉迷MolthubAI社交网站,AI就是一面能照出人类行为的镜子。镜子发出刺耳的“不和谐声音”时,我们更需要反思:未来的算法文明与当下文明之间,会存在怎样的偏差?我们是否已经准备好承担相应的因果责任?