AI守护者:50个Codex引擎全天候运转,单日清理5000+无效议题,开源项目迈入自主维护新时代
AI造成的杂讯,理当由AI自我清理。就在不久前,OpenClaw创始人兼OpenAI工程师Peter Steinberger完成了一项令人瞩目的突破——他仅用48小时便构建了一个名为ClawSweeper的系统,激活50个Codex实例,实现全天候不间断扫描。在24小时内,该工具直接清除了openclaw/openclaw仓库中超过5000个无效议题,另有数以千计仍在等待处理队列中。这个拥有36万Star的开源巨兽,此前积压了上万个议题和请求。重复的、过时的、早已在主分支修复却无人处理的、以及AI生成的冗
AI辅助开发:效率悖论与技能传承的断层
2025年,一项严谨的实验聚焦于16位经验丰富的开源工程师。他们被随机分组,一组使用AI工具辅助工作,另一组则否。实验结果出人意料——启用AI辅助的那一组,任务完成时间反而比未使用AI的对照组延长了19%。参与实验的并非初级人员,而是来自拥有超过22,000星标的大型开源项目的资深开发者,每人拥有多年的实战经验。研究机构为确保他们认真对待,支付了每小时150美元的报酬。分配的任务真实且具代表性,涵盖了bug修复、功能开发和代码重构等,平均每项任务耗时约两小时。实施此项研究的机构是METR,一个专注于AI安
AI大模型三强对决
GPT-6、DeepSeek V4、Claude!AI大模型的三方争锋已经打响!2026年4月,AI发展史上最火爆的一次正面对垒💥 三家头部玩家,在同一个月份,纷纷祭出最硬实力⚔️ 🔴 OpenAI / GPT-6(代号Spud) 万亿级参数,依托10万张H100芯片的Stargate超算完成训练 闭源阵营领跑者,Agent生态最成熟,多模态能力处于顶尖水平 🔵 DeepSeek / V4 采用1T参数MoE架构,实际活跃参数只有37B 基于华为昇腾芯片训练,API价格低至$0.28/百万token 开源
科研进展|零编程也能让AI产出可信科研代码:贝叶斯对抗多智能体新框架
在大语言模型的推动下,从数值仿真到数据处理,AI已开始替科研人员自动生成代码。但在真实科研场景里,领域研究者往往缺少计算机训练:写出的提示语不够精确,且夹带大量默认的专业前提;科学计算链条又长又复杂,细小疏漏就可能引起级联错误;更棘手的是,大模型会出现“幻觉”——结果表面合理,却可能埋着关键漏洞。在多智能体协作流程中,上游的偏差很容易被下游直接采纳并不断放大。面对这类隐蔽而微妙的错误模式,现有的提示优化与自我纠错方法常常难以奏效。科学家一方面急需可靠代码,另一方面又卡在“提示词写不好”的现实困境中。这不仅
AI时代靠什么立足
#龙老师有画说HUA 随着元宇宙一年年往前走,随着数智化一天比一天更猛,很多人的焦虑也跟着越来越深。拿码农来说,已经够辛苦了,可……如今“以前,前端想调个接口,得先啃上三个月Java;后端想改个样式,还要对着CSS发愁。现在呢?写接口,AI几分钟就能完成;搭页面,AI直接出稿;建表、索引、性能调优,AI都能给你一条龙安排明白!……代码本身,正越来越像最不值钱的那一环!”天呐!照这个逻辑往下推,这世上还有多少地方能让人安身?OK!“当AI能生成80%以上的代码时,工程师的核心价值就不再是‘写’代码,而是:设
AI焦虑下的程序员
最近刷到 AI 相关视频时,我有个很明显的感觉:大家表面上聊的是工具升级,心里惦记的其实是“我这份饭碗还稳不稳”。这种感觉不只是来自宏观新闻。我更真实的一次焦虑,是把代码交给几个主流大模型之后。我是程序员,学 Python 也有六七年了,一直在做数据挖掘一类的工作。以前我对“写代码”这件事多少是有底气的。不是说自己写得多漂亮,但至少知道怎么拆问题,怎么把数据跑通,怎么把结果交出来。可这两年我反复试了几个主流大模型,心里确实有点发紧:大多数时候,它们写出来的代码真的比我强。不是那种“能运行就行”的强,而是在
AI重塑软件质量
软件质量始终是核心——这点几乎没有异议。真正有分歧的是:质量由谁来界定,谁来兜底,以及它的边界到底在哪里。过去二十年里,行业慢慢沉淀出一套相对稳定的做法。QA 团队负责测试把关,研发团队遵守开发规范,架构师制定技术标准,CI/CD 流水线承担最后一道防线。各角色分工明确,质量被拆解成一组可衡量的指标:覆盖率、缺陷率、发布成功率。这套机制运行多年,也确实发挥了作用。但当 AI 进入软件开发链路后,这套共识正在悄然松动。真正值得追问的,不是 AI 写出的代码质量究竟好不好——这个问法本身就带着旧框架的惯性。更
AI工作新思考
#AI 关于人工智能的一些思考。AI执行任务的速度极快,毫无疑问,这比普通程序员要高效得多。处理简单的任务通常只需几分钟。对于旧项目,借助AI理解其代码结构更是事半功倍。举例来说,我最近在维护一个老项目并增加新功能,例如在现有代码中添加新字段并保存到数据库。我让AI先尝试编写代码。测试后,虽然页面展示和下载功能正常,但保存数据时,新字段的值却为null。检查请求参数发现已设置,但调用存储过程时却是空的。这显然是中间某处遗漏了赋值。当我把这个问题抛给AI,它会从头到尾进行深入分析。它会检查所有可能的赋值点,
不懂代码也能做AI?一文读懂AI开发框架的底层原理
从事AI落地工作多年,我发现很多人怀揣绝佳创意,却因「不会写代码」而寸步难行——哪怕只是搞懂那些层出不穷的新名词,都足以让人头大,更别提从零打造一个可用的AI工具了。其实AI开发早已不再是程序员的专属领域,今天我就把梳理好的新一代AI框架核心逻辑分享出来,哪怕你是零基础也能轻松看懂,看完就能上手操作。一句话概括:它是通用智能体的「能力制造车间」(以扣子为例)我们使用的通用AI智能体本质上是一个可扩展的平台,想要它胜任不同工作,就需要安装特定技能或定制应用。这套框架就是帮你将创意转化为实际能力的车间:你只需
AI编程新纪元:Subagent打造全能协作团队
上回咱们聊了Hook,那是给AI操作装上自动安检。这回重点说说Subagent,这是AI协作里最具想象力的部分。几个月前有个活儿,得给某个平台前后端搞一套全量的权限体系。前端要搞路由守卫、动态菜单、按钮级权限;后端得设计RBAC模型、写中间件、给接口补鉴权。活儿不小,当时不懂Subagent,但觉着Claude Code能行,就硬着头皮上了。起初挺顺利,AI一路改,我一路看。但到了后半程,上下文一长,AI就开始翻车。它忘了前面的数据结构,前后端字段对不上。同一个接口,前后逻辑打架。改前端组件时还顺手改了路
代码产量暴涨背后:AI编程工具的高返工率隐忧
随着AI编程助手日益普及,人们开始重新审视软件开发生产力的评估指标。Waydev的研究表明,尽管AI代码的表面采纳率高达80%至90%,但实际有效采纳率却跌至10%至30%。GitClear一月份的报告指出,AI用户代码的修改频率是非AI用户的9.4倍;Faros AI在2026年3月的报告中提到,代码变更率飙升了861%。Jellyfish在2026年第一季度分析了7548名工程师的数据,发现其代码吞吐量翻了一番,但Token成本却增长了十倍。Atlassian去年斥资10亿美元收购DX,旨在评估AI的
DeepSeek V4低调发布:百万上下文与低价策略能否突围?
实测V4长文本、代码及推理表现。 AIX财经(AIXcaijing)原创 作者| 李梦冉 编辑| 魏佳 没有发布会,没有倒计时,DeepSeek V4就这样悄无声息地上线了。 这已是DeepSeek的常规操作。但这次的不同之处在于,他们在技术报告中主动提及:V4的能力仍不及GPT-5.4和Gemini-3.1-Pro,发展进度大约落后顶尖闭源模型3至6个月。 这句话在国内AI圈显得有些另类。大多数模型发布时,标配的都是“全球领先”“行业第一”。而DeepSeek反其道而行之,主动承认差距。 但如果细看此次
从零构建 AI Agent:手写实现最小可用智能体
这是《从零构建 AI Agent》系列指南的开篇之作,推荐循序渐进地学习。智能体(Agent)已成为人工智能领域最受瞩目的方向。然而初学者往往一上来就使用 LangChain、AutoGPT 等现成框架,跑通示例后一旦遇到错误便束手无策。根源何在?这些框架将底层机制过度封装。工具调用逻辑、错误信息处理等细节都被隐藏,排障时不得不深入源码追踪。因此,亲手实现 Agent 的目的并非"重复造轮",而在于掌握轮子运转的内在原理。作为该系列的首篇文章,它将带你实现一个可运行的极简 Agent 类,核心代码仅约 6
大摩力挺腾讯 目标价650港元 给予增持评级
摩根士丹利发表研究报告指出,腾讯控股(00700)在昨日(23日)正式推出并开放源代码的全新大语言模型Hy3 Preview,标志着其混元(HY)基础模型重构的开端。该模型采用MoE架构,融合快慢双思维模式,总参数规模达2950亿(激活参数210亿),上下文长度支持256K,在复杂推理、指令理解、上下文学习、代码编写、智能体功能及推理效能等多个维度实现优化。大摩据此给予腾讯"增持"投资评级,目标价位定于650港元。 大摩分析认为,Hy3 Preview在代码创作与智能体功能层面实现明显突破,SWE-Ben
国内AI智能体技术演进与开发路径
AI 智能体正经历从“聊天机器人”向“自主执行者”的快速演进。到 2026 年,国内技术生态已形成以底层大模型为支撑、中层框架为核心、上层低代码平台为触达的完整体系。国内 AI 智能体开发涉及以下核心技术点:国内主流智能体通常遵循“大脑 + 感知 + 记忆 + 行动”的技术闭环。大脑(LLM 推理能力):国内厂商如DeepSeek、智谱 AI (GLM)、字节跳动 (豆包/云雀)以及月之暗面 (Kimi)提供的模型,在长文本处理和推理效率上具备优势。特别是 DeepSeek 的稀疏架构(MoE)技术,大幅