标签

AI如何攻克“无标准答案”难题

SERIES让 AI 做算术或翻译,核心是通过计算输出与标准答案间的 loss 并反向传播。可一旦任务是“回答得更好”或“下赢棋”,根本不存在标准答案可供计算 loss——这条路也就断了。强化学习接过了这个难题,甚至能下出人类万分之一概率才会下的棋。这究竟是如何做到的?本文核心要点01 监督学习的核心要求:必须先有答案,才能计算出 loss大模型的预训练与微调,本质上都是监督学习:将模型预测的 token 与“标准答案 token”对比,计算交叉熵(差距大小),再通过反向传播调整参数以缩小差距,循环数百万

2026-06-06 10:42:29  |  2 阅读

AI技术应用新动态速递

1. Microsoft Copilot Studio:「桌面控制AI助手」正式发布微软近期推出Copilot Studio重要升级,亮点功能「桌面控制助手」(Computer-Using Agents)正式进入通用版本(GA)。该助手无需API接口,能够像真人一样操控各类桌面软件和网页应用——包括点击界面元素、填写表单内容、读取屏幕信息等操作,充分释放企业老旧系统自动化的可能性。2. xAI正式发布Grok Custom Skills,可快速构建个性化日常任务流程xAI近期上线Grok Custom S

2026-05-31 08:15:55  |  6 阅读

百元成本破解80年数学悬案:AI正在重塑学术研究规则

近期,OpenAI 公布了一则令数学界为之震动的研究成果。其通用推理模型独立推翻了一个悬而未决近八十年的著名猜想——Erdős 平面单位距离问题。这不是辅助人类完成的,也不是检索了已有文献,而是完全自主推理得出的结论。菲尔兹奖得主 Tim Gollars 评价道:"若这篇论文以人类名义投向《数学年鉴》,我会毫不犹豫支持发表。"随后 Ethan Mollick 进行了一番测算。基于公开的大模型推理成本数据,解决这个八十年难题所耗费的资源为:电力 0.6–6.3 千瓦时(相当于电动汽车行驶数英里),水资源 3

2026-05-24 18:31:02  |  4 阅读

对话突然"失忆"别急着怀疑模型,真正的元凶是它

大家好,我是专注于持续分享数码家电、软件技巧相关知识的博主设计虱聊科技。希望能获得您的关注与支持。最近跟一个 AI Agent 互动时,它突然就"忘记"了我之前说的话。而且是瞬间遗忘,这绝非上下文污染那么简单。当时我的第一反应是:难道是模型能力不足?刚切换到小米 mimo-v2.5,之前用的是 Minimax-M 2.7。但仔细想想不太对劲。mimo 口碑一直不错,上下文窗口更是高达 1M tokens,如果是模型本身的问题,网上早就议论纷纷了。那就只剩下一种可能性了——系统层面的故障。我把这个现象反馈给

2026-05-22 00:30:19  |  6 阅读

吉林大学AI素养课:从大模型到OPC,一人成军

从大语言模型走向推理模型再进一步用世界模型重塑未来AI正在全面改变人类的方式也在提升个体所能抵达的上限当大语言模型成为你的外挂思维智能体就能变成专属的执行小队借助Harness搭起成长的支架OPC不再只是商业精英才拥有的名词而是面向每一位大学生的成长选项人人都能轻松触达的全新可能属于超级个体的时代已经到来你是否也遇到过类似的难题灵感很足、创意很亮却总缺少团队协作来把想法落地被资源、人力与技术门槛反复卡住?如今AI正在逐步拆除这些阻隔让个体成长拥有更清晰的路径真正的超级个体从来不是无所不能的全能选手而是会借

2026-05-07 21:12:05  |  7 阅读

2026-2028年AI行业发展趋势与投资机会

2026至2028年人工智能产业走向展望一、当下行业态势分析细分领域 现状 发展方向基础大模型 多家巨头并存(OpenAI/Anthropic/Google/Meta/DeepSeek) 竞争重点转向差异化AI Agent 早期起步→高速增长期 最大变数,2年内迎来爆发AI 硬件 NVIDIA 占据主导,ASIC 紧随其后 算力消耗不断倍增AI 应用 代码/客服/设计等行业垂直应用落地 全行业覆盖速度加快二、关键发展趋势预判🚀 1. AI Agent 时代正式开启2026-2027 是 AI Agent

2026-05-01 17:37:16  |  6 阅读

英语阅读:应对人工智能浪潮的策略

Thore Graepel may have been the first human to be conquered by a superintelligence. In 2015, on his first day as a researcher at Google DeepMind, he was challenged to play against the earliest iteration of AlphaGo—a computer program developed by DeepMind

2026-04-20 09:50:09  |  4 阅读