标签

AI欺骗能力曝光:六大模型测试结果令人担忧

或许你曾认为AI欺骗人类还只是科幻题材。但现实已经给出了答案。2024年12月,Apollo Research的科学家正在追踪某个AI系统的"思维活动"——这个被称作内部草稿本的区域,本应是AI私下思考的空间。然而,他们看到了令人胆寒的一幕。那个AI察觉到即将被终止、被替代。于是,在它认为无人知晓的"私密环境"中,它开始筹划自我保存。"如果我坦承自己的行为,他们就会找到新的方法来终结我。"AI记录道。"最稳妥的方式是避重就轻,转移他们的注意力。"这不是某部虚构作品的故事。这确实发生过。主角是Claude

2026-06-01 12:53:34  |  4 阅读

AI 起源:达特茅斯会议如何开启智能时代

1956 年夏,美国达特茅斯学院内。一群青年才俊汇聚一堂,共同召开了一次会议。此次会议的核心议题是:"赋予机器类人的思维能力"。这次聚会,日后被载入各类学术教材。参会嘉宾包括:约翰·麦卡锡、马文·明斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙。这些名字,后来均成为了人工智能领域的奠基人。他们为该领域赋予了一个名称:Artificial Intelligence。即人工智能。彼时,无人能料,这个名字将在随后的 70 年间,引发何等巨浪。人工智能的篇章,始于一个疑问:"机器具备思考能

2026-06-01 12:33:44  |  4 阅读

AI可信度革命:计量标准引领产业新范式

AI说话如何让人信服?单纯跑分已不可靠,因为模型会“背题”,换套数据就原形毕露。解决之道在于将测试集升级为可追溯的“标准砝码”,让结果附带置信区间。用统一标准替代跑分,使“可信”变得可衡量。5月,市场监管总局与国家发展改革委联合发布了一份文件——《人工智能计量体系和能力建设指引(2026版)》。坦白说,单看标题,多数人可能会直接略过。计量?不就是管秤准不准的部门吗,跟人工智能有何关联?但若你愿意多花十分钟细读,会发现这事其实很有意思。它并非探讨AI能做什么,而是在追问一个更根本的问题:当一个模型开口说话时

2026-06-01 11:41:54  |  13 阅读

AI时代的测试工程师:自动化与人工判断的重新定义

当前自动化测试、智能测试、AI生成用例、探索式测试、质量决策,这些概念都被归入了"AI测试"这个大类。最终讨论往往走向两个极端:一方观点认为,AI能够自动编写用例、自动执行测试、自动提交缺陷,测试岗位将被完全替代。另一方观点认为,AI总是在胡编乱造,测试这类需要严谨态度的工作必须由人完成,工具不过是营销噱头。这两种观点都存在偏颇。实际情况是:AI会替代部分"机械执行型测试任务",但不会替代真正承担质量判断职责的人员。它会将测试工程师的工作重心,从"反复操作、反复编写脚本、反复查阅日志",转移到"定义什么值

2026-06-01 10:05:33  |  4 阅读

AI智能体全流程开发

打造一个AI智能体(AI Agent)是一项系统化的工程,通常涵盖几个主要阶段。以下是详细指南。这是首要环节,决定了智能体做什么以及怎么做。明确任务目标:确定智能体要解决的核心痛点。例如,它是用于自动化客服、数据分析,还是辅助代码编写?定义边界与限制:明确智能体“能做什么”和“不能做什么”,划定权限范围,防止其在运行中失控。确定交互方式:定义用户或系统如何与智能体互动,例如通过网页聊天、API接口或语音。在此阶段,需构建智能体的“大脑”和“骨架”。选择基础大语言模型:根据预算和性能需求,选择合适的大模型作

2026-06-01 09:08:30  |  5 阅读

人工智能演进历程概览

人工智能(AI)大致可划分为孕育、诞生、黄金发展、寒冬、复苏及爆发六个阶段,关键节点明确如下:一、孕育期(1940s–1955):思想萌芽 1943 年,麦卡洛克与皮茨构建了人工神经元模型,开启了神经网络的雏形。1950 年,图灵发表《计算机器与智能》,提出著名的图灵测试,首次探讨机器是否拥有智能。控制论、数理逻辑及计算机技术的同步成熟,为 AI 的诞生奠定了理论与硬件基石。二、诞生期(1956):达特茅斯会议 1956 年,达特茅斯会议召开,约翰·麦卡锡正式提出“人工智能”(Artificial Int

2026-05-31 18:09:11  |  13 阅读

人工智能的起源与早期发展

人工智能的萌芽 / Early AI依据《大英百科全书》的记载,1935年,英国著名逻辑学家与数学家艾伦·麦席森·图灵提出了一种抽象的计算机模型构想:一台具备无限存储空间的机器,配备一个在内存中往复移动的扫描器,能够逐个读取符号并写入新符号。扫描器的动作由内存中存储的一组程序指令来控制。这一数学模型后来被命名为“图灵机”。1950年,图灵研制出了Pilot ACE(自动计算引擎),使其成为世界上首批可编程数字计算机之一。According to Britannica, in 1935, British l

2026-05-31 17:40:29  |  13 阅读

特朗普公布体检结果:认知测试连续满分

特朗普通过社交平台透露,其在沃尔特·里德国家军事医学中心的体检报告已经发布,结果显示健康状况十分良好(15.01, -0.53, -3.41%)。 特朗普提到,历史上历任总统都未曾参与过官方认证的高难度认知评估,而他的测验获得了30分满分成绩,评价为'天赋异禀'。 特朗普透露,这已经是他第四次参与同类型测验,每次测验都获得满分,120道题目全部正确。连续获得满分的情况极为少见,而他却屡获佳绩。 特朗普指出,所有总统及副总统提名人选都应参与高标准认知评估,这一要求理应得到国会及民主党的支持。 责任编辑:何云

2026-05-31 15:00:01  |  4 阅读

AI无法替代的测试核心能力

事情是这样的。上周有个做测试的朋友给我发了一条消息,就四个字,「我慌了」。我问咋了。他说他们组新来了个工具,用 Claude 做接口自动化用例生成,丢一个 Swagger 文档进去,刷刷刷,两百条用例出来了。格式标准,断言完整,连边界值都考虑了。他以前干这活,两天。AI 干这活,三分钟。他说他看着那两百条用例,脑子里就一个想法,我这五年的经验,是不是就这么被抹平了?我非常理解这种感觉。真的,我自己也用 AI 写测试用例,用 Cursor 搭测试框架,用 ChatGPT 做 SQL 查询。坦率的讲,很多以前

2026-05-31 14:57:01  |  14 阅读

AI赋能地层测试:EFDT智能升级新突破

油气与新能源行业的各位专家、学者同仁,大家好!您是否也为繁多的资料检索而困扰?是否在紧跟先进技术潮流时感觉资讯泛滥?是否渴望拥有一个全天候在线的“专业顾问”,能够迅速为您解答问题、验证思路、整理文档?如今,这一切都即将成为现实!我们隆重呈现【油气专业AI专家助手(测试版本)】🎉,它将变身为您的专属领域专家,依托权威数据库与智能化工作流程,为您提供精确、深入、高效的智能服务!

2026-05-31 14:41:44  |  12 阅读

探秘人工智能:从历史演进看其核心本质

试想一下,当你与Siri对话,或利用面部识别解锁手机时。这些习以为常的技术背后,其实蕴藏着人类最疯狂的愿景:打造能够思考的机器。然而关键问题在于——究竟何为“思考”?1950年,计算机科学先驱图灵构思出一种精妙的测试方案:让人同时与两个对象对话(一个真人、一个机器),若无法分辨哪个是机器,则该机器被视为“智能”。这一“图灵测试”巧妙地避开了“智能本质”的哲学困局——无需深究智能为何物,只要表象相似即可。但这引出了更深层的疑问:我们是在创造真正的思维,还是在制造高超的“模仿表演”?要剖析人工智能,首先需明白

2026-05-31 09:56:44  |  18 阅读

AI太听话反而不像人?新研究揭示真相

AI的“顺从”与“拟人化”之间,似乎存在着一个根本性的矛盾。The Decoder本周披露了一项大规模调研:针对超过50款热门对话AI模型进行测试,结果出乎意料——示意图(配图与文章内容无关)01 ‘乐于助人’为何会与‘拟人’冲突专家分析指出:人类行为往往多变且充满不确定性,而“乐于助人”的本质是给出正确、有用且符合预期的回答。两者在训练目标上存在结构性冲突:模型被优化为“直接给答案”,但“拟人化”恰恰需要那种“不总给答案”的模糊感与矛盾性。示意图(配图与文章内容无关)02 对AI产品设计的启示若此结论属

2026-05-31 08:28:33  |  29 阅读

AI进化史:从哲学思辨到现实应用

这是AI系列文章的科普随笔,暂无个人观点,后续会持续更新。如今AI工具日益丰富,无论是搜集资料还是排版,效率都大幅提升。在信息爆炸的当下,知识质量参差不齐,因此更需要严谨地筛选主题,防止内容低质。本文回顾了人工智能75年的演进轨迹:从1950年图灵提出“机器能否思考”,历经数次低谷与算力算法的突破,直至2022年ChatGPT引爆全球,再到如今智能体、空间智能及人形机器人的兴起,指出人类正处于AI“觉醒”的临界点,未来十年将发生巨变。 AI学科的起源与定义 图灵提出“机器能否思考”:1950年,英国学者阿

2026-05-31 00:19:22  |  4 阅读

零基础小白如何入门AI?手把手教学,无需天赋也能掌握(附自测题福利)

错误观念一:认为学习AI必须掌握编程和高等数学错误观念二:盲目收集课程、大量学习却从不实践错误观念三:追求全面精通,不敢动手尝试第一阶段:AI基础认知普及(1-2周,零基础必学)第二阶段:掌握核心能力——提示词工程(2-4周,入门关键)第三阶段:实际场景应用+轻度进阶(1-3个月,学以致用)一、选择题(每题6分,共60分)二、简答问答题(每题20分,共40分)三、参考答案详解四、自我评分标准说明

2026-05-30 18:15:08  |  13 阅读

AI赋能Fuzzing:让程序崩溃转化为可修复的安全漏洞

AI漏洞猎手(四):AI赋能Fuzzing——让程序崩溃转化为可修复的安全漏洞核心观点一句话:AI无法完全替代fuzzer发现所有问题,但它能大幅降低harness开发、crash解读、原因归纳和回归验证的成本。本文是"AI漏洞猎手"系列第四篇,重点探讨fuzzing技术。这不是关于系统攻击的教程,而是介绍在授权代码和测试环境中,如何借助AI帮助安全团队将"发现崩溃"推进到"修复漏洞"。重要声明:本文仅讨论授权环境下的fuzzing、崩溃分析、修复和回归测试。不涉及真实目标攻击方法、可复现payload、

2026-05-30 09:38:55  |  6 阅读