用AI核查AI:我开发的fact-check工具四次踩坑记
上周遇到一件让人后背发凉的事。AI帮我汇总资料时写道「Claude现在是200k token」,还信誓旦旦地引用了官方博客作为佐证。但实际上现在已经是1M token了。它并非故意欺瞒,只是把半年前的数据当作当下事实写了出来。这种失误最危险,因为表述得很肯定、还能搬出各种背书资料,肉眼根本无法辨别。等真正派上用场时才发现「这个早就改了」,之前基于错误信息做出的决策全得推倒重来。于是我开发了一个叫fact-check的skill,专门让AI去验证AI整理的内容是否准确。工作原理很直接:把内容中的事实陈述逐条
人机协作实践心得
技术选型、功能范围、边界界定,这些核心决策需要人来把控。AI 的角色是执行落地,而非替代人类做判断。具备扎实基础的人借助 AI 如虎添翼,基础薄弱的人使用 AI 则可能事与愿违。对架构、业务、工程的理解深度,决定了你驾驭 AI 的上限。AI 无法弥补个人短板,只会让强者如虎添翼。面对涉及面广或难以把握全局的问题,先启用 plan 模式进行系统性思考和步骤规划。将方案保存到项目中,防止中途打断后,新会话丢失之前的上下文。理清思路比快速写代码更关键。将大功能分解为小模块,每完成一个独立单元就提交一次。避免期待
人形机器人半马赛场上暴露的技术难题
摔倒即数据,限时即倒逼,人形机器人(15.160, 0.13, 0.86%)需要在压力中完成迭代。 4月19日,在北京亦庄人形机器人半程马拉松现场,不少人惊叹于“闪电”机器人跑赢人类的速度,还发现今年“翻车”场面似乎变少了。 今年共有102支赛队,完赛队伍47支。其中,以自主导航方式完赛的赛队18支,以遥控方式完赛的赛队29支,完赛率超45%。对比去年首届半马,仅有6支队伍成功完赛。 清华大学自动化系研究员赵明国介绍,通过这场比赛可以发现机器人硬件的可靠性、续航能力、自主能力都有改进。 第一财经记者注意到