AI 编程 Bug 激增背后的真相
AI 编程带来的体验日益提升,甚至超越了部分初级开发者,然而近期发布的大模型在编程辅助上 Bug 频发,究竟为何 Bug 数量不降反升???
可能存在以下几种情形:
1、大模型厂商暗中削减了推理算力
大模型企业一方面对外提供服务(供我们使用),另一方面需训练新模型。当前显卡紧缺、内存价格飙升,厂商将部分算力转向训练,导致对外服务资源缩减(我们感知到的就是模型变“笨”了)
2、训练大模型遭遇瓶颈
举例而言,GitHub 上的优质代码均由人类编写,将这些代码输入大模型,模型基于概率生成接近人类风格的代码,因此 AI 编程水平持续攀升。但近期水平下降,原因在于人类借助 AI 编写代码后,仅做简单功能测试便直接提交至 GitHub,缺乏逐行代码审查。长期如此,大量程序员重复此操作,AI 无法获取新知识。从信息熵角度看,这一过程仅导致信息熵减少
3、项目规模急剧扩大
AI 生成代码速度极快,单日可产出数万行代码,如此庞大的代码量直接压垮了 AI 对话的上下文窗口。后续虽引入上下文压缩机制,但压缩必然造成信息丢失,导致 AI 对项目整体理解片面,进而引发更多 Bug
因此,“古方编程”绝非无用。正因上述原因,加之大模型固有的幻觉问题,致使项目代码库日益混乱。如今多家公司因 AI 编程大幅裁减程序员,但不到一年,待到两三年后,这些公司遗留的“代码屎山”将有多严重?谁又能负责维护?谁又能修复 Bug?