标签

2026-06-29 AI前沿速递:3分钟掌握今日热点

发布时间:2026-06-29 08:18阅读:2

时间:2026-06-29 08:02 · 共统计 10 条资讯 · 关键词:DeepReinforce、AI、科技

DeepReinforce团队发布了开源Agentic编程模型 Ornith-1.0 ,依托 Gemma 4 和 Qwen 3.5 的架构,运用自研改进训练框架。该模型包含9B至397B四个版本,在Terminal-Bench 2.1及SWE-Bench Verified测试中均取得了顶尖水平。

• 详情:https://ai-bot.cn/ornith-1-0/

腾讯混元开源了 PhoneBuddy 4B 手机Agent模型,并发布了PhoneWorld、PhoneHarness等5篇论文,完整覆盖环境、训练、执行、隐私及安全全流程。其核心亮点在于Real+Mock混合RL训练,结合真实App与自建PhoneWorld模拟环境,让4B模型在150项真机测试中多项指标胜过GPT-5.4。

• 详情:https://mp.weixin.qq.com/s/ej8uAGXb9mmDirwVDSsI8g?scene=1&click_id=25

Mistral AI 发布了最新的文档识别模型 Mistral OCR 4 ,支持10个语族共170种语言,在OmniDocBench上拿下93.07分。与GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品相比,其输出更符合人类偏好。该模型不仅输出文本,还能提供边框、区域分类和置信度评分,支持RAG语义分块等后续任务。

• 详情:https://www.ithome.com/0/968/835.htm

一位个人开发者,竟在众多大厂模型中脱颖而出,跻身抱抱脸Models Trending榜前列?!

这是平凡的一天,我也照常浏览着抱抱脸的Trending榜。

排在首位的是GLM-5.2,智谱最新开源的模型,老面孔了,下载量6万多,意料之中。

第二是百度的无限OCR,近期低调开源的,一次能解析40多页文档,下载量也冲到了7万。

再往下翻,突然出现了一个个人账号: yuxinlu1 。

• 详情:https://www.qbitai.com/2026/06/439603.html

看到有个网站设计得特别精美,想做一个类似的?

现在不用打开F12一行行复制CSS了!GitHub上有个2万Star的项目专门做这个——

ai-website-cloner-template ,一条命令,就能像素级克隆任意网站。

• 详情:https://www.qbitai.com/2026/06/439515.html

它专注于一口气读完几十页长文档,在OmniDocBench上刷新SOTA,整体表现超越了之前的DeepSeek OCR。

不同于传统OCR处理长文档时“逐页读取再拼接”的思路,Unlimited OCR这次模仿了一种类似人类抄录员的工作方式:

不再死记硬背之前抄过的内容,而是只保留当前工作所需的信息和进度。

• 详情:https://www.qbitai.com/2026/06/439464.html

Agent并不是不会用浏览器,只是探索太费时——BrowserBC将人类操作轨迹蒸馏成可复用技能来实现行为克隆,用户点一遍,Agent照着就能执行。

如今的Web Agent,不再缺少“会操作”这一能力。

Claude、Codex这类Agent能看页面、识别按钮和输入框,能点击、输入、跳转、提交。

• 详情:https://www.qbitai.com/2026/06/439393.html

刘谦早年刚出道变魔术时,曾流传过一个故事。

客户打来电话,接待的是Jason;确认需求后,Jason会让Susie报价;Susie再找Mary商量表演内容。

经过几轮沟通,刘谦才带着两个助理正式现身,西装革履,向客户演示PPT。

这个故事一度成为笑谈,因为Jason、Susie和Mary其实都不存在。

二十多年前,一个人假装成一家公司,多少还像场魔术。

• 详情:https://www.qbitai.com/2026/06/439237.html

继VLM-R1之后再次发力!全球首个端侧流式多模态来了!

CVPR刚过去没几天,会上还在热议的方向,就已经被一家杭州团队落地到端侧!

刚刚,Om AI 发布了全球首个面向物理世界的端侧流式多模态模型系列——

VLX专注于真实世界的端侧和具身场景,共有三款模型,三天内连续发布:

这三款模型组合起来,不仅构成了多模态模型持续感知、精准定位和行动决策的能力闭环。

• 详情:https://www.qbitai.com/2026/06/439236.html

AI能否真正创造价值?组织因素的影响权重是个人的两倍。

也就是说,如果你AI用得不好,三分之二的责任得由公司承担。

这个反直觉的洞察,来自微软一年一度的《Work Trend Index》(WTI)。

今年的主题颇具火药味:AI时代,员工已准备好,但领导和组织尚未准备好。

这并非空谈。

• 详情:https://www.qbitai.com/2026/06/439032.html