参数压缩_标签-酷阅新闻

小模型大推理！微博VibeThinker-3B惊艳国际，探索AI高效新方向

近期，微博发布的小参数模型VibeThinker-3B在海外社交平台引起轰动，迅速登上Hugging Face首页热点榜前列及hacker news热榜第四名。这个仅有30亿参数的密集推理模型，在数学解题、竞赛编程等高难度可验证推理任务中，已跻身Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5等国际领先模型的性能区间，在国内也足以媲美豆包、MiniMax、GLM、Kimi等一线模型的水平。 “小而精”的推理专家：专注背后的技术逻辑据了解，这

2026-06-25 16:31:32 | 19 阅读

压缩即智能

在“ai眼里”，人类所有信息的表达，本质上不过是token之间的衔接关系。它的输出方式可以理解为更高级的文字接龙：根据当前内容，优先给出出现概率最高的下一个字；而只要算力足够，就能不断往下接。看起来这套流程有点粗，但放到当下却很实用，关键原因之一在于：当模型对token之间的关系、也就是参数的容纳空间足够大时，就更容易产生涌现。ai里这些参数如何形成，业内通常称为训练；而我更愿意把它类比成“蒸馏”。这是一种逆向工程，就像我们小时候做英语完形填空：题目给了空，我们填词可能填错了，随后再学习修正；而ai则会在

2026-05-07 14:20:49 | 26 阅读