2026-06-29 AI前沿速递:3分钟掌握今日热点
时间:2026-06-29 08:02 · 共统计 10 条资讯 · 关键词:DeepReinforce、AI、科技
DeepReinforce团队发布了开源Agentic编程模型 Ornith-1.0 ,依托 Gemma 4 和 Qwen 3.5 的架构,运用自研改进训练框架。该模型包含9B至397B四个版本,在Terminal-Bench 2.1及SWE-Bench Verified测试中均取得了顶尖水平。
• 详情:https://ai-bot.cn/ornith-1-0/
腾讯混元开源了 PhoneBuddy 4B 手机Agent模型,并发布了PhoneWorld、PhoneHarness等5篇论文,完整覆盖环境、训练、执行、隐私及安全全流程。其核心亮点在于Real+Mock混合RL训练,结合真实App与自建PhoneWorld模拟环境,让4B模型在150项真机测试中多项指标胜过GPT-5.4。
• 详情:https://mp.weixin.qq.com/s/ej8uAGXb9mmDirwVDSsI8g?scene=1&click_id=25
Mistral AI 发布了最新的文档识别模型 Mistral OCR 4 ,支持10个语族共170种语言,在OmniDocBench上拿下93.07分。与GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品相比,其输出更符合人类偏好。该模型不仅输出文本,还能提供边框、区域分类和置信度评分,支持RAG语义分块等后续任务。
• 详情:https://www.ithome.com/0/968/835.htm
一位个人开发者,竟在众多大厂模型中脱颖而出,跻身抱抱脸Models Trending榜前列?!
这是平凡的一天,我也照常浏览着抱抱脸的Trending榜。
排在首位的是GLM-5.2,智谱最新开源的模型,老面孔了,下载量6万多,意料之中。
第二是百度的无限OCR,近期低调开源的,一次能解析40多页文档,下载量也冲到了7万。
再往下翻,突然出现了一个个人账号: yuxinlu1 。
• 详情:https://www.qbitai.com/2026/06/439603.html
看到有个网站设计得特别精美,想做一个类似的?
现在不用打开F12一行行复制CSS了!GitHub上有个2万Star的项目专门做这个——
ai-website-cloner-template ,一条命令,就能像素级克隆任意网站。
• 详情:https://www.qbitai.com/2026/06/439515.html
它专注于一口气读完几十页长文档,在OmniDocBench上刷新SOTA,整体表现超越了之前的DeepSeek OCR。
不同于传统OCR处理长文档时“逐页读取再拼接”的思路,Unlimited OCR这次模仿了一种类似人类抄录员的工作方式:
不再死记硬背之前抄过的内容,而是只保留当前工作所需的信息和进度。
• 详情:https://www.qbitai.com/2026/06/439464.html
Agent并不是不会用浏览器,只是探索太费时——BrowserBC将人类操作轨迹蒸馏成可复用技能来实现行为克隆,用户点一遍,Agent照着就能执行。
如今的Web Agent,不再缺少“会操作”这一能力。
Claude、Codex这类Agent能看页面、识别按钮和输入框,能点击、输入、跳转、提交。
• 详情:https://www.qbitai.com/2026/06/439393.html
刘谦早年刚出道变魔术时,曾流传过一个故事。
客户打来电话,接待的是Jason;确认需求后,Jason会让Susie报价;Susie再找Mary商量表演内容。
经过几轮沟通,刘谦才带着两个助理正式现身,西装革履,向客户演示PPT。
这个故事一度成为笑谈,因为Jason、Susie和Mary其实都不存在。
二十多年前,一个人假装成一家公司,多少还像场魔术。
• 详情:https://www.qbitai.com/2026/06/439237.html
继VLM-R1之后再次发力!全球首个端侧流式多模态来了!
CVPR刚过去没几天,会上还在热议的方向,就已经被一家杭州团队落地到端侧!
刚刚,Om AI 发布了全球首个面向物理世界的端侧流式多模态模型系列——
VLX专注于真实世界的端侧和具身场景,共有三款模型,三天内连续发布:
这三款模型组合起来,不仅构成了多模态模型持续感知、精准定位和行动决策的能力闭环。
• 详情:https://www.qbitai.com/2026/06/439236.html
AI能否真正创造价值?组织因素的影响权重是个人的两倍。
也就是说,如果你AI用得不好,三分之二的责任得由公司承担。
这个反直觉的洞察,来自微软一年一度的《Work Trend Index》(WTI)。
今年的主题颇具火药味:AI时代,员工已准备好,但领导和组织尚未准备好。
这并非空谈。
• 详情:https://www.qbitai.com/2026/06/439032.html