标签

AI测评神话破灭:不解题也能登顶排行榜

2026年4月,UC Berkeley研究组向科技圈投下一枚重磅炸弹。他们开发了一套自动化检测系统,对8个顶级AI Agent评测体系展开了全方位审查。结论令人震惊:全部评测体系均存在可被"劫持"的缺陷——即便不处理任何真实任务,依然能够获得近乎完美的评分。SWE-bench:100%可劫持率。WebArena:近100%。FieldWorkArena:100%。GAIA:98%。这并非纸上谈兵。研究组真实构建了可运作的漏洞利用代码,并向这些评测平台正式提交了结果。这也不是学术演练。它动摇了规模达2000

2026-04-14 06:10:51  |  6 阅读

日企巨头抱团斥资万亿研发本土大模型

软银携手NEC、本田及索尼等巨头组建“日本AI基础模型开发”企业,旨在合力推进本土人工智能研发。该新企股东实力雄厚,软银、NEC、本田和索尼四家均持有超过10%的股份,日本制铁和三菱UFJ银行等机构也加入了投资行列。职责划分方面,软银与NEC主攻模型构建,而本田和索尼则致力于应用场景落地。该企业计划招募100名技术人员,初期致力于构建万亿参数级大模型供日企使用,后续还将研发驱动机器人的AI技术。据透露,该企业已向日本经产省提交申请,计划在未来五年内获取总额约1万亿日元(约合人民币428亿元)的政府补贴。此

2026-04-13 18:57:17  |  3 阅读

信任危机:当AI未来掌控者陷入风暴中心

2026年4月10日,凌晨3点45分,旧金山太平洋高地。整座城市仍处于沉睡之中。一枚燃烧瓶撕裂夜空,砸向一栋标价2700万美元的豪宅外墙。火焰冲天而起,保安在消防队抵达前控制了火势。这栋房产的主人正是OpenAI首席执行官Sam Altman。警方当场拘捕了一名20岁男子。被押后他并未保持缄默,反而扬言要纵火焚烧OpenAI总部。针对个人的袭击,由此升华为对整个AI行业的象征性挑战。几乎在同一时刻,另一场"攻击"正以不同形态在互联网上扩散。GPT-6的技术片段现身于暗网及技术论坛。泄露资料虽少,却足以在技

2026-04-13 16:56:56  |  5 阅读

伊朗议长:美方须以实际行动重获信任

伊朗议会议长卡利巴夫在结束对巴基斯坦的访问行程返国后,就本次谈判相关议题接受媒体采访时称:“首要之务是向伟大的伊朗人民致谢。他们通过祈祷为谈判提供支持,响应领袖的号召,比以往更加积极地走上街头表达支持。诚如最高领袖在讲话中指出,民众的此举有力助推了我们维护伊朗民族权益,同时也使谈判对手更深入地认识和理解我们的革命事业,这是我亲眼所见的事实。我们展开了高度密集、严肃认真且充满挑战性的磋商。我方代表团依靠现场专家的专业素养,从全面多维的角度出发,通过团队协作,拟定多项体现伊朗诚意的优秀方案,促使谈判向前推进。

2026-04-13 02:25:28  |  6 阅读

人工智能潜藏的结构性危机,多数人难以置身事外

虚实混淆:人工智能能够制作出以假乱真的影像、声音与新闻,大众往往难以分辨上级指示、亲友呼救或突发事件的真假,致使欺诈、污蔑与舆论操控的代价大幅降低。信息壁垒:个性化推荐算法与生成式AI结合,为你精准推送信息,你浏览的内容由AI筛选,不同个体对同一事件的认知可能天差地别,个人被禁锢于AI构建的信息孤岛,思维方式最终趋于僵化。信任危机:当所有图像、语音、文字都可能被怀疑是AI伪造时,社会互信的基础将遭受严峻考验。数据压榨:你与人工智能的每一次交互都在训练它,但你无法分享模型增值带来的利益。大型资本集团掌控你的

2026-04-13 02:06:53  |  6 阅读
美伊会谈破裂:两大症结与五大深层障碍解析

美伊会谈破裂:两大症结与五大深层障碍解析

新华社北京/华盛顿4月12日电(记者阚静文 徐剑梅 刘晨)美伊两国代表在巴基斯坦首都伊斯兰堡的磋商于12日随着美方率先离场而宣告破裂,双方未能达成任何协定。 伊斯兰堡会谈期间,双方探讨了哪些议题?揭示了何种根本分歧?观察人士指出,此次会谈为美伊提供了直接交换立场的契机,但仅靠一场持续整日的谈判难以化解彼此间的根本矛盾与结构性冲突。对话以失败告终,意味着伊朗战事可能重燃并进一步激化。国际社会正密切关注美伊接下来的动向。 这是4月11日在伊斯兰堡拍摄的美伊会谈新闻中心。新华社发(王申摄) “未取得进展、未达成

2026-04-12 14:44:30  |  6 阅读

伊朗宣布暂停对美核谈磋商

在巴基斯坦调解的会谈失败后,伊朗方面宣称暂无意向与美国展开新一轮核问题对话。伊朗最高国家安全委员会旗下的努尔通讯社表示:"目前尚未发布关于后续谈判的具体时间与地点信息。"在结束漫长的磋商、离开伊斯兰堡前夕,美国副总统万斯宣称已拿出"终极最佳提议",随后启程回国。"我们静候伊朗方面的回应。"伊朗外交部发言人指出,前两次核对话皆因美以军事冲突而被迫中止,伊朗方面已难以重建对美国的信任。他强调:"我们铭记在心,永远不会遗忘美国的失信之举与不良企图。"该发言人还披露,除讨论霍尔木兹海峡议题和伊朗核项目外,双方还就

2026-04-12 11:43:59  |  7 阅读

AI换脸技术冲击社会信任体系

近期,一位知名艺人遭遇"虚拟劫持"事件在社交媒体引发轩然大波——不法团伙借助AI换脸技术,将其面容合成到不当视频中索要500万元赎金。据安全部门统计:2023年全球深度伪造诈骗案件暴涨8倍,普通民众仅需3秒就可能被"窃脸"。 技术滥用的三大可怕趋势 1. 黑色产业链形成:暗网兜售"20元速成"教程,附带身份证照片套餐标价68元 2. 骗术精细化:不法分子通过视频通话模拟亲属声音与微表情,单个案件诈骗金额最高达430万元 3. 检测难题:当前深度伪造识别技术错误率仍高达12%,受害人维权平均耗时半年 更令人

2026-04-10 01:10:00  |  34 阅读

Z世代AI信任度降温,焦虑情绪上升

人工智能巨头Alphabet(GOOGL)及其同行正遭遇信任危机,盖洛普与沃尔顿联合调研显示,即便Z世代周使用率仍过半,但越来越多人对AI产生焦虑与愤怒情绪。

2026-04-09 21:02:30  |  4 阅读

Mythos 5震撼登场、OpenAI风雨飘摇、中美AI博弈白热化|AIGC日报0408

【一句话开场】 2026年4月7日,全球AI领域同时引爆三大焦点:Anthropic祭出十亿亿参数的“安全大杀器”,OpenAI遭自家CFO与《纽约客》双面夹击,中美科技对抗悄然升温。【头条】Mythos 5:精准猎杀27年陈年老洞的“数字特种兵”Anthropic推出的Claude Mythos Preview,开创了十亿亿参数模型的先河。它在实战演练中完成了数项惊人壮举:成功捕获一个潜伏27年的OpenBSD远程崩溃缺陷——该系统以高安全性闻名,广泛应用于防火墙与核心设施;揪出FFmpeg中隐藏16年

2026-04-08 18:48:13  |  6 阅读

AI仿冒风波:直播带货的信任危机与治理挑战

同一时间,同一个人,身着不同服装,“现身”不同的直播间推广产品,动作神态与本人高度相似。这是演员温峥嵘遭遇“AI盗播”的场景。“如果你是温峥嵘,那我是谁?”她前去质问,却被直播账号拉黑。2025年“双11”期间,北京市民王欢在某社交平台刷到一条童装推广视频,画面中两名“儿童”在玩滑板时身体竟然融合在一起,暴露出明显的数字合成痕迹。直到看见角落一行“内容由AI生成”的提示,她才意识到这竟是技术合成的幻象。这并非孤例。从央视主持人李梓萌的AI形象被用于虚假营销,到中国工程院院士张伯礼公开“打假”冒用其形象的A

2026-04-04 11:19:43  |  4 阅读
年报出问题,信任危机加剧

年报出问题,信任危机加剧

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:第一财经 责任编辑:张乔松 新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

2026-04-03 18:09:45  |  17 阅读

董宇辉带货再陷信任危机:央视揭穿“假洋货”,文化人设遭遇重击

头部主播董宇辉主理的“与辉同行”直播间,再度被推至舆论聚光灯下。 4月1日,央视新闻公开揭露网红保健品“澳洲优思益”的系统性造假行为——品牌渊源纯属虚构,国际奖项系高价购得,所谓“墨尔本注册地址”实为一家汽修铺,现场充斥机油气味,毫无保健品生产痕迹。该产品实为国内代工厂贴牌出品,连国家认证的保健食品“蓝帽子”资质都未取得。广东市场监管、海关及公安三部门随即启动联合执法,对涉事企业立案调查,相关品牌全线撤柜。 公众视线迅速聚焦于董宇辉。“与辉同行”是该品牌核心销售渠道,成交额预估在1000万至2500万元之

2026-04-03 16:23:44  |  7 阅读
伊朗外长谴责袭击民用设施

伊朗外长谴责袭击民用设施

当地时间4月2日晚,伊朗外长阿拉格齐针对卡拉季市贝伊克公路桥遇袭事件在社交媒体上发表声明,明确表示针对民用设施的袭击无法迫使伊朗人民屈服。 阿拉格齐强调,这种行为仅暴露了敌方的失败与道德沦丧,而伊朗人民将修复并强化每一座桥梁与建筑。然而,敌方在声誉、可信度及信任方面的损失将无法弥补。 当天,伊朗卡拉季市的贝伊克公路桥遭到袭击,导致桥梁主体结构受损,相关路段已被完全封闭。(总台记者 李健南 李曌)

2026-04-03 07:20:03  |  5 阅读

AI行业遭遇挑战

AI行业最近确实经历了不少波折,正处于一个从‘狂热讲故事’到‘残酷算账’的调整期。虽然没有彻底崩盘,但过去的一周,几家明星公司相继出现问题,揭示了整个行业的共同危机:💥 行业‘连环雷’ · OpenAI(财务问题):由于严重亏损,不得不关闭备受瞩目的视频模型Sora,据说其每日运营成本高达1500万美元,核心团队也出现了流失,资本的信心也开始动摇。 · DeepSeek(算力瓶颈):自成立以来最长的宕机时间,连续三天,总计超过12小时。原因是用户量激增,导致算力不足,反映了‘幸福的烦恼’。 · Anthr

2026-04-03 06:46:03  |  5 阅读