标签

最新AI研究速递:2026年5月第5周精选

1. 基于视频生成技术从蜂窝信号重建GPS轨迹的新方法原文标题: Think over Trajectories: Leveraging Video Generation to Reconstruct GPS Trajectories from Cellular Signaling发布时间: 2026-03-27论文链接:http://arxiv.org/abs/2603.26610v1移动终端与基站之间持续进行数据交换,产生了大量信令日志可用于分析人类移动模式。但这类数据只能提供基站覆盖范围等粗略位置信

2026-05-25 07:19:29  |  4 阅读

人工智能周报 | 本周AI创投与大模型最新动态

📅 覆盖时间:2026年5月22日 — 5月24日 📊 共 20 条(🇨🇳 国内 14 条 | 🌍 国际 6 条)Source: 36氪 |Published: 2026-05-24 |Heat: ⭐⭐⭐⭐⭐ (75) | 🇨🇳 国内概述: 2026年人工智能领域投资热潮持续升温。仅5月份,月之暗面、阶跃星辰等国内大模型企业便斩获超300亿元资金,具身智能同样成为资本追捧对象,维他动力、鹿明机器人等在一周内连续获得数亿元融资。据投资机构数据显示,一季度人工智能行业融资事件近600起,总金额超1100亿元,

2026-05-24 20:42:32  |  5 阅读

谷歌发布超高速AI模型,284.2 token/秒刷新响应速度纪录

2026年5月23日 · AI大模型 · 人工智能AI研究社Google I/O 2026刚结束,谷歌就一口气发布了三个新模型,没有预热,没有分阶段推送,直接全部亮相。最引人注目的是Gemini 3.5 Flash,推理速度达到284.2 token/秒,这个数字比GPT-5.5快了4倍。速度这个东西,说出来可能没感觉,但实际用起来差别很大。你问它一个问题,284 token/秒意味着几乎感觉不到延迟,就像跟人聊天一样顺畅。更重要的是,Flash定位高并发、低成本实时交互,这不是为了跑分好看,而是真的要把

2026-05-23 20:22:27  |  7 阅读

AI漫剧赛道终局:10分钟视频免费生成

亲眼见证了AI漫剧的最终章,当其他AI视频工具还在纠结5秒或10秒的短片时,这个平台直接颠覆规则:免费无限创作,最长可生成10分钟连贯视频。当部分AI视频工具还在比拼5秒或10秒短片时长,该平台已能产出1至10分钟的完整视频,支持多语种,免费无限制,生成迅捷,即便是新手也能轻松驾驭。更令人惊叹的是,平台内置海量现成模板,只需输入一段提示词,系统便自动生成剧情、角色及场景,连背景音乐也一并配齐。最终呈现角色、情节、运镜统一的完整电影级画面,无需真人出镜或专业设备,普通人也能轻松制作出大片质感。若你怀揣创意,

2026-05-23 20:12:54  |  8 阅读

瞬镜AI 接入SeedDance2.0 真人审核服务

瞬镜 AI 平台正式启用 SeedDance2.0 官方真人审核机制。当前平台已全面对接 SeedDance2.0 全环节视频生成技术,涵盖文字转图像、图像转视频等全阶段创作应用。此次真人审核功能的推出,将从根本上化解 AI 生成内容的合规隐患,显著减少创作者的修改成本与发布风险。真人审核定义:Seed Dance 2.0 官方真人审核是获得 Seed Dance 官方独家授权的合规审查服务,采取 AI 智能初检与官方复核结合的双重标准化审核流程。针对文字转图及图像转视频素材,平台已实现图片审核快速通过,

2026-05-23 14:31:06  |  7 阅读

AI短漫剧的成本与效率之问

520 刚过完,朋友圈都在问:还爱不爱了。但做 AI 短漫剧的佬友们,最该问的是:贵不贵?毕竟一条镜头能不能跑出来,决定的是情绪;一批镜头能不能持续跑下去,决定的是钱包。所以今天不聊浪漫,聊一个更现实的问题:AI 短漫剧创作者的1秒,到底多少钱?但! 我们先盯住三个点:真正满血的 Seedance2.0。不排队。可真人。再! 加一个更现实的数字:<0.69元/s>对偶尔玩一下的人来说,这只是一个价格页。但对高频创作者、OPC、微型工作室、承制方来说,它其实在回答一个更具体的问题:我能不能把 See

2026-05-21 11:15:05  |  7 阅读

AI圈大事件:国产模型突破、巨头IPO在即、行业收入飙升

01 千问3.7-Max亮相:面向Agent时代的基座模型阿里千问推出全新旗舰模型Qwen3.7-Max,定位为Agent时代的全能基础模型。该模型在编程、通用Agent及复杂推理等测试中表现优异,在35小时、1158次工具调用的自主优化实验中,实现了10倍的几何平均加速。它原生适配Claude Code、OpenClaw等主流智能体框架,支持MCP集成与多智能体协作,即将通过阿里云百炼API上线服务。02 OpenAI模型突破性证明80年数学猜想OpenAI宣布其内部通用推理模型成功解决了数学家埃尔德什

2026-05-21 10:04:44  |  8 阅读

Veo4 解锁多机位:AI 漫剧的曙光还是虚火?

谷歌 I/O 大会尚未开幕,Veo4(代号 Gemini Omni)的核心机能已提前曝光。此次最震撼的并非画质的再度飞跃,而是——AI 终于掌握了镜头切换的技巧。针对同一场景,Veo4 能自动产出 2 至 6 个不同视角的画面,镜头切换成功率超 85%。无论是人物面容、物体方位还是环境细节,均能在跨镜头间保持一致。再结合原生音画同步技术,对话、环境音效及背景音乐皆可一站式生成。听起来似乎很完美。但身为一名 AI 漫剧的一线从业者,我必须泼盆冷水:多机位叙事虽是漫剧制作的天花板,可 Veo4 目前距离触碰这

2026-05-20 16:03:54  |  7 阅读

AI 视频迈向构建完整世界

NVIDIA Research 推出的 SANA-WM 颇具看点。它并非寻常的短时长视频生成手段,而是聚焦世界模型领域:致力于 60 秒级视频、720p 画质、相机操控及长视频的空间连贯性。对于创作者而言,关键不在于即刻投入商用,而在于洞察 AI 视频的演进趋势:从单纯生成美观片段,升级为构建可连续运镜的完整场景。#AI视频 #世界模型 #NVIDIA #AI工具 #视频生成NVIDIA Research 推出的 SANA-WM 颇具看点。它并非寻常的短时长视频生成手段,而是聚焦世界模型领域:致力于 60

2026-05-20 08:53:14  |  8 阅读

深度测评百款AI应用后,为职场人精选这4款国产利器

WorkBuddy是一款深度融入日常工作流程的AI全能助手。它不仅仅是对话工具,而是真正能够代你完成各项任务:处理腾讯文档、发送QQ邮件、智能撰写周报、创作图片视频和3D模型……所有功能汇聚于单一界面。对新手最友好的功能当属:【探索】专区。内置11个日常工作高频场景模板,一键即可启用。无需掌握复杂的提示词技巧,也不用纠结选择哪个模型,就像使用美图秀秀的滤镜功能,选择模板、自动应用、直接获取成果。然而除了这11个开箱即用的场景模板,WorkBuddy还隐藏着许多你可能完全不了解的实用功能:这些功能,随便拎出

2026-05-19 15:29:48  |  5 阅读

赛博望远镜AI日报:Musk败诉与电影级视频模型

📅 2026年5月19日 🔖 第 23 期| 阿里云HappyHorse电影级视频生成模型上线 || Anthropic收购API工具公司Stainless || Elon Musk起诉OpenAI败诉 || Claude Code跑通全套科研流水线 |核心内容:Anthropic正式宣布完成对知名API开发工具厂商Stainless的收购,此举意在巩固其开发者工具生态,全力推动Claude API的生态系统扩展。详细解读:核心内容:Elon Musk针对Sam Altman及OpenAI发起的诉讼正式宣

2026-05-19 13:41:59  |  6 阅读

AI前沿一周速览:技术、政策与产业动态

1技术追踪(1)Token消耗最高直降61%:腾讯云结构化记忆方案大幅提升Agent长任务成功率近期,腾讯云正式开源TencentDB Agent Memory,旨在为Agent长任务场景提供短期记忆压缩与长期个性化记忆能力。面对代码开发、网页搜索、研究分析等场景中任务链路不断延长,导致工具调用、网页内容及中间结果快速填满上下文窗口,引发Token成本攀升、任务状态丢失及推理稳定性下降的问题。TencentDB Agent Memory通过“上下文卸载+Mermaid任务画布”技术,将完整信息转存至外部存

2026-05-18 18:31:27  |  6 阅读

抖音AI热潮:三大趋势引领内容革命

近期抖音 AI 相关热榜资讯持续刷屏,行业焦点清晰汇聚于字节自研 AI 应用与模型商业化、AI 短剧生态扶持、创作者 AI 工具全民普及三大核心方向。从底层模型迭代到爆款内容量产,从技术开放到商业闭环,抖音正以 AI 为引擎,重构内容生产与变现的全链路生态。字节跳动自研 AI 体系已形成 “豆包大模型 + 即梦创作平台 + Seedance 视频模型” 的核心矩阵,2026 年进入商业化兑现关键期,成为抖音生态的技术底座与增长引擎。作为字节通用大模型核心产品,豆包已成为国民级 AI 助手,2026 年 Q

2026-05-18 15:19:45  |  8 阅读

AI编程与模型革新推动行业变革

2026年5月18日周一|AI开源日报要点速览:一是 AI 编程进入企业级和多 Agent 阶段,二是视频生成、Physical AI、Graph RAG 成为新热点,三是 AI 商业化收入继续扩大,四是开源工具链正在围绕 Agent 的检索、成本、流程管理和安全治理快速补齐。1. GPT-5.3-Codex成为GitHub Copilot企业版默认模型GitHub 已将 GPT-5.3-Codex 设为 Copilot Business 和 Enterprise 的默认基础模型,替代此前的 GPT-4.

2026-05-18 14:51:26  |  7 阅读

第10周预告:AI+素养同城共学课堂报名开启

“AI+素养・同城共学”系列课程下周预告(5月18日、5月20日、5月22日)1第二十一讲从职业规划到Offer:AI助力你的职场之路5月18日 14:00杨豆琪(上海工程技术大学)本次讲座围绕三大核心板块:利用多种AI工具对比分析职业方向,破除信息障碍,科学定制个性化成长路径;借助AI简历助手高效优化高质量简历;通过AI模拟面试官系统掌握面试技巧,还原真实面试情境。告别方向困惑、简历无回应及面试不知所措的难题,全程指导您掌握AI赋能求职的完整流程。2第二十二讲AI辅助视频制作:低成本实现专业化呈现5月2

2026-05-18 10:58:55  |  5 阅读