近期AI模型研习心得
最近几天我正在钻研AI。尽管此前我对AI的态度一直不冷不热,导致相比社会主流显得有些保守。
不过,由于我长期使用VSCode,通过其产品交互的更新迭代,多少能窥见大众使用AI的方式。此外,借助自媒体信息流,我也大致了解了AI的应用场景及开发范式。
近期打算学习AI,主要基于以下几点变化:
尽管其背后的逻辑与修改仍面临巨大挑战。
虽然这过程无需程序员介入,但这既是优势也是隐患。
但是VSCode Copilot需要付费使用。
因此,基于上述四点,上周我简单学习了AI,目标如下:
接下来,介绍一下我个人的工作站配置:
12核心,24线程
主频 4.4GHz
二/三级缓存:12 MB / 64 MB
120W 功耗
显存:16GB
这台机器购于2025年,26年霍尔木兹海峡被封锁后,内存价格飙升。当年花2000元买的64G内存觉得天价,如今64G内存已涨至7200元。
不过,显存才是关键,考虑到未来会使用AI技术,当年我特意配备了16GB显存的显卡。没想到面对如今的大模型,16GB显存确实让人望而却步。但也有好消息,一是游戏体验极佳,二是足以支持本地代码补全。
方案:VSCode + Continue Plugin + Ollama + qwen2.5-coder:7b
虽然VSCode在Chat功能上能接入其他大模型,但在代码补全方面并不支持第三方。后来我找到了Continue[1]。
在VSCode安装Continue后,配置页面可选择Models。但不知为何,默认的Autocomplete栏是灰色禁用状态,需要通过Yaml进行配置:
ollama也是Archlinux上易于获取的工具,还能自动拉取开源模型,所以我选择了它。
选用qwen2.5-coder:7b是受限于显存。而且Continue官方推荐的自动补全模型也仅到qwen2.5-coder:7b[2],甚至建议用1.5b,我想7b对我来说肯定足够。
最后附上一条VSCode Inline Suggestion的官方文档[3]
似乎现在大家都将这类AI称为Agent,我不太理解。但大意是可以通过Agent来编写代码,最典型的便是ClaudeCode。
一位产品经理朋友告诉我,她的产品全由AI生成,包括所有文件,她只需与AI对话即可。
我问她如果有BUG怎么办?她回答:继续跟AI聊,让它修改。
这印证了我以前在团队里对同事说的话:现在你可以用AI开发,但必须做好后续持续用AI迭代产品的准备。
当然,这不仅是说AI能完整开发产品——这对程序员意味着将唯一可控的事物变得不可控,这是无法接受的(所以我格外青睐代码自动补全)。
但对产品经理而言,程序员本身也是不可控因素,因此用AI替代程序员,在产品经理的逻辑中并无矛盾。
促使我学习AI的还有另一个理由——代码重构。我曾见Twitter和微信公众号上许多人用AI进行代码重构,并表示可行。这让我惊讶——要知道传统“软件工程”旨在让技术债可控,但随着软件规模扩大,维护成本呈指数级上升。若能通过AI重构工程,将代码维护性降回低成本状态,那确实是伟大创举,也可能意味着旧系统的新生。
但我也了解他们的重构过程——据说要整理大量文件,与AI沟通数十小时。甚至有沟通数天,然后让AI自行运行,最终耗时一个月完成重构的案例。虽是道听途说,但我认为,无论AI增速还是应用场景都逐渐清晰,这正是我深入学习AI的好时机。
随后我开始搜索可用的模型。前段时间吵得火热的便是国产之光DeepSeek。
无论是社会创新还是学术界都提到AI平权,但如今Tokens的成本究竟是多少?
可见deepseek的价格极具吸引力,尤其对我这种只想尝试的人来说。
此外,我还看到一个票选程序员最爱模型的网站[9],最受欢迎的模型(按积极程度排序):
最受欢迎的开源模型:
虽然这里的开源模型参考价值不大——因为支撑如此大的模型,所需的硬件投入是个体玩家难以承担的。
所以我毫无疑问选择了DeepSeek,并充值了20元(铁公鸡拔毛了)。
[1]Continue:https://docs.continue.dev/ [2]qwen2.5-coder:7b:https://docs.continue.dev/ide-extensions/autocomplete/model-setup [3]Inline Suggestion 的官方文档:https://code.visualstudio.com/docs/copilot/customization/language-models#_change-the-model-for-inline-chat [4]Claude Price:https://claude.com/pricing#api [5]openAI Price:https://openai.com/zh-Hans-CN/api/pricing/ [6]qwen3-max Price:https://bailian.console.aliyun.com/cn-beijing/?spm=5176.29597918.J_F4r-7Zs_PtjrjEY48APSA.d_primary.5200133cTg9pJV&tab=doc#/doc/?type=model&url=2987148 [7]Kimi K2.6 Price:https://platform.kimi.com/docs/pricing/chat-k26 [8]deepseek Price:https://api-docs.deepseek.com/zh-cn/quick_start/pricing [9]各种模型:https://hnup.date/hn-sota