AI数据新纪元:从资源积累到智能基石
如需报告请联系客服或扫码获取更多报告(1000份+报告)伴随“人工智能+”在各行各业的深入发展,数据已从静态资源转变为驱动大模型智能涌现的关键动力。2025年,全球AI数据产业经历了深刻的供给侧改革:由追求PB级规模的粗放增长,转向注重高密度、高信噪比的“质量至上”;由单一文本模态迈向图文音视频融合的“多模态融合”;由集中式数据处理演进为分布式的隐私计算与联邦智能。本章将系统解析AI数据技术的最新范式变革,重点阐述以合成数据、非结构化文档解析、向量数据库等基础设施的升级,并结合国家数据局“数据要素×”与“
AI助力中国突破光刻胶技术瓶颈
光刻胶被誉为芯片制造的“画笔”,而KrF光刻胶树脂则是这支画笔的核心“笔毫”。如今,人工智能正在帮助中国打造自主的顶级“笔毫”。5月12日,上海人工智能实验室公布了一项具有重大意义的技术突破:研究团队依托“书生”科学大模型与“书生”科学发现平台,成功构建了“AI决策+自动化合成”的闭环研发体系,实现了高纯度、高一致性、高效率的KrF光刻胶树脂创制。这标志着高端光刻胶树脂的稳定制备首次摆脱了对少数国外供应商“黑箱技术”的依赖。要理解这项成果的重要性,首先需要了解中国在光刻胶领域面临的挑战。光刻胶是芯片制造中
我国科学家成功实现人工细胞非对称分裂
记者5月13日获悉,由中国科学院化学研究所主导的科研团队,运用生化分子触发人工细胞内部产生选择性剥离操作,首次达成人工细胞在形态与功能层面的非对称分裂,为打造具备基本生命特征的人工细胞体系提供了全新思路。 天然细胞具备对称与非对称两种分裂模式,其中非对称分裂指将一个细胞分裂为两个存在差异的子细胞,这是生命体实现细胞分化、器官发育以及功能多元化的关键基础。因此,构建能够模拟天然细胞分裂行为的人工细胞,成为合成生命研究的重要方向。 中国科学院化学研究所研究员乔燕介绍,针对这一挑战,研究团队精心设计了一种具有结
印度批3750亿卢比方案,推进煤气化战略
5月13日,印度内阁正式通过一项总额达3750亿卢比(约合39.2亿美元)的专项规划,致力于大规模实施煤气化工程,把国内充裕的煤炭资源转化为洁净工业能源,进而减少对进口燃料的依赖。 印度信息部长阿什维尼·维什瑙(Ashwini Vaishnaw)在当天的发布会上强调,该计划的核心在于推动煤炭向合成气转化,并广泛应用于电力、化肥制造及石化等重要工业环节。维什瑙指出,鉴于中东局势动荡持续影响全球能源供应,这一举措将显著降低印度对液化天然气(LNG)、尿素、氨及甲醇等大宗物资的进口需求,对国家能源安全具有深远的
英派药业-B上市首日暴涨76.62%
英派药业-B(07630)正式登陆资本市场,公告披露,每股发行价设定为20.1港元,总计发行4197.7万股,每手200股,募集资金净额约为7.6亿港元。截至今日早盘,该股股价飙升76.62%,收报35.5港元,成交活跃,金额达2.07亿港元。 据公开信息显示,英派药业是一家已步入商业化阶段的生物科技公司,其核心业务是推进基于合成致死机制的精准抗癌疗法,旨在通过创新手段填补癌症患者未被满足的医疗缺口。公司明星产品塞纳帕利已于2025年1月获准在中国卵巢癌“全人群”的一线维持治疗中应用,并随即开启商业化进程
人工智能 model 训练中合成数据的治理策略
目次一、问题的提出:AI 的未来是合成的?二、真实数据在 AI 模型训练中的局限与挑战三、合成数据在 AI 模型训练中的治理优势四、我国合成数据治理路径的制度构造结语一、问题的提出:AI 的未来是合成的?生成式 AI 飞速发展依赖于底层模型对大规模数据模式与结构的识别能力。过去十年间,AI 模型训练的数据参数已从最初的百万量级迅速扩展到十亿乃至百亿量级,模型性能的持续提升与迭代升级高度依赖于更大规模、更高质量的数据输入。可以认为,训练数据的有效供给已经成为 AI 发展的关键。然而,现实世界真实数据的获取与
AI新石油危机:数据枯竭下的技术转折
大家好,我是万象大叔。专注 AI,讲透技术,看清产业,商业落地,投资布局。将数据比作AI的“新石油”,在早期揭示了其驱动价值,却也掩盖了一个致命的差异:石油是地质储量,而互联网公共数据是可耗尽的一次性资源。当前,以大语言模型为代表的AI发展范式,正清晰地撞上“高质量数据墙”。这并非未来风险,而是正在发生的现实约束。其真相在于:驱动本轮AI浪潮的“规模化训练”范式,其燃料供给曲线即将触及自然上限。这不仅是一个数据规模问题,更是关于数据质量、多样性、法律与算力经济模型的系统性危机。Scaling Law 指明
AI行业周动态 | 5月5日至5月10日
1技术追踪(1)豆包Seed 2.0 Lite升级:首款全模态理解模型近期,火山引擎宣布,Doubao-Seed-2.0-lite迎来新版本迭代,这是豆包大模型系列中首款实现全模态理解的产品。据官方介绍,新版Doubao-Seed-2.0-lite实现了视频、图像、音频、文本的原生统一理解,Agent、Coding与GUI能力也同步升级,进一步针对复杂业务场景强化多模态推理性能。此次升级的核心亮点在于融入了语音理解能力,新版本能够同时处理多种输入模态,并完成跨模态联合推理,直接应对那些需要“音画结合”才能
警示!AI 诈骗新招频出,务必严加防范
近期,不法分子借助 AI 语音克隆、AI 换脸视频等尖端技术行骗的案例激增,此类手法极具隐蔽性,令人难以招架。诈骗分子通过非法途径获取受害人亲友、上司或同事的个人信息、生活照及语音素材后,能迅速合成出逼真的声音与影像,随后利用微信、电话等工具联系受害者,编造突发急事、资金短缺、协助转账或信息核验等借口,以此博取信任并实施诈骗。无论是假扮亲属谎称遭遇意外急需资金,还是伪装成领导指示私下汇款,亦或是冒充客服以退款理赔、账户异常为由进行诱导,其核心均是利用 AI 技术伪造身份实施犯罪。这类诈骗真假难分,一旦轻信
倒计时开启!AI与合成生物智造论坛9月苏州开幕,报名通道已启动
在全球化生物制造向智能化、高效率转型的浪潮中,我们正迎来一场深刻的产业变革。人工智能技术迅猛发展,AI与合成生物学的紧密结合、大模型与深度学习算法的突破,正在成为驱动产业创新与升级的关键力量。作为两者深度融合的前沿领域——“AI合成生物智造”有望革新生物制造研发范式,成为塑造产业未来格局的战略高地。发展与困境并存,AI赋能生物制造仍面临一系列核心难题,包括研发周期冗长且投入巨大、优质生物数据储备匮乏、“信息壁垒”现象严重,算法模型与生物系统的实际复杂性不相匹配等,这些都在一定程度上阻碍了技术转化与产业化进
AI驱动二维钙钛矿反向设计:能级精准调控新突破
图1 基于AI辅助的DJ型二维钙钛矿目标能级发现逆向设计流程。图注:以12位分子指纹为核心,融合高通量DFT、机器学习及合成筛选,完成从分子生成、模型训练、候选筛选到实验验证的全流程逆向设计。图2 DJ钙钛矿有机间隔基的可还原分子指纹表征。图注:将有机间隔基拆解为共轭骨架、锚定铵基、侧链及取代基,各部分编码为数字指纹,最终组合成完整的12位指纹向量。图3 高通量数据生成与能级分布:(A)分子生成骨架树状图;(B)化学空间t-SNE分布;(C)DJ钙钛矿有机与无机组分间的能级匹配关系。图注:通过13种形变操
AI编造谣言引热议,天水警方迅速出手!
针对少数网民借助AI编造不实内容并在网上散布谣言天水市公安局秦州分局网安大队近日进一步强化网络巡查对AI合成虚假短视频等涉谣问题依法处置持续净化网络环境,守护网络安全今年3月,秦州分局网安大队在工作中接到谣言线索。秦州区网民王某在某网络视频平台发布所谓“2026年度甘肃省考答案”。民警随即将王某传唤至公安机关展开调查。经查,王某系参加2026年甘肃省考的考生,其在短视频中于2026年3月13日发布的“省考答案”,来源于他在与朋友聊天、开玩笑的过程中借助AI生成,随后将该内容上传至某短视频平台。其本意是通过
AI算力猛增,数据瓶颈显现:下一代模型进化何去何从?
大型人工智能模型(LLM)正以惊人的速度扩展,但其赖以生存的数据资源却面临着枯竭的风险。《2026年人工智能指数报告》警示,全球顶尖AI研究人员指出,用于训练大型模型的高质量人类文本和网络数据已接近饱和,这一现象被称为“数据峰值”(Data Epoch)。Epoch AI的预测显示,在特定假设下,这种数据短缺可能在2026年至2032年间变得显著。这一趋势不仅挑战了AI开发者的技术前提,也引发了业界对“规模法则可持续性”的疑虑。过往,模型性能的提升主要依赖于数据集的规模扩张,但当可用数据量接近上限时,性能
协同治理剑指短剧“偷脸”乱象
随着人工智能技术加速迭代,视频内容的制作方式正在被持续改写。尤其在短剧赛道,人工智能换脸、深度合成等手段显著降低了制作投入、压缩了创作周期,让行业更快迭代并释放出新的增长动能。但在技术红利背后,“偷脸”早已不只是影视作品里的想象桥段,而已在现实中演变为侵权行为:部分短剧制作方在未获授权的情况下,擅自抓取并使用他人的面部生物识别信息,借助人工智能技术生成角色形象,进而侵害公民肖像权、个人信息权乃至名誉权。为回应这一持续出现的现实问题,有必要梳理现行法律制度在衔接与适用上的堵点与盲区,以形成系统化的治理思路。
萌桔子AI视频课正式开讲
别再让技术牵着你走!AI 视频的热潮正持续升温,普通人也能借助 AI 把想法拍成大家爱看的爆款。本期萌桔子 AI 视频制作公开课,吸引了刚毕业的学生、影视从业者、纯 AI 新手、电商从业者、线下实体老板等不同背景的创作者共同参与。我们不卖空洞概念,只带你从零开始完成 AI 视频的全流程落地实践,帮你把创作主动权握在手里,让你的故事更快成片、更容易被更多人看到。开课仪式现场,满是嘱托与期待分享告一段落,立刻切换到沉浸式实操环节。整场公开课以“动手为主、讲解为辅”为原则,围绕 AI 脚本生成、画面设定、分镜绘