标签

设备端语音AI:语音交互正在取代传统键盘

过去多年间,业界在各类应用场景中持续尝试推广语音AI技术,但效果一直不太稳定。当前,多个关键因素共同发力,使得语音AI开始走向普及,语音驱动的人机交互界面正迎来快速发展的"黄金期"。这些推动因素主要包括:语言模型的重大突破、低功耗的设备端AI处理芯片、语音输入方式的广泛采用、情境感知智能的快速成长,以及完善的生态系统和开发者资源支持。这些要素相互配合,将充分释放语音输入的巨大潜力,使其真正成为主流的输入方式。回顾过去数十年,计算机和终端设备的人机交互经历了从文本终端,到图形界面、鼠标操作、手写笔、多点触摸

2026-06-05 11:37:28  |  2 阅读

生成式AI推动知识创新

生成式人工智能与知识生产创新知识生产与两个关键环节密不可分:知识的产生和知识的传播。两者相辅相成:好的知识是好的传播的动力源,而好的传播又能通过知识的"教化"作用,在人们利用所学解决各类问题的生产和生活实践中催生更多好的知识。古往今来,上述过程"环复转运,终始无端",不断丰富着人类的知识宝库。在漫长的历史演进中,知识的生产与拓展,长期带有少数"智者"留下的鲜明印记。随着时代的发展,"智者群"的数量会渐次扩大,但在整个人群里相对来说仍是少数。进入现代社会特别是互联网时代,这种状况发生了急剧变化,普罗大众可以

2026-06-02 22:39:32  |  3 阅读

超越图灵测试:构建新的人工智能评估体系

关键事实:2024至2025年间,GPT-4、GPT-4.5等大型语言模型已正式通过图灵测试。这一存在76年的“智能标准”被突破——然而我们并未因此迎来真正的“人工智能时代”,反而面临更深层的思维挑战。1950年,艾伦·图灵提出了著名的“模仿游戏”概念:如果一台机器能在对话中使人类无法识别其非人身份,则可认为它具备“思考能力”。这一标准在人工智能领域主导了76年之久。然而现在——结论:机器已经掌握了“欺骗”人类的能力。图灵测试作为衡量智能的标准,已名存实亡。图灵测试的基本假设是:“行为模拟 = 智能显现”

2026-06-02 08:06:55  |  3 阅读

欧洲AI领军企业Mistral获宝马与空客大单

总部位于欧洲的人工智能行业翘楚米斯特拉尔AI公司(Mistral)日前宣布,已与欧洲两大制造业巨头宝马(BMW)及空客(Airbus)达成战略合作伙伴关系。米斯特拉尔在巴黎召开的首届开发者大会上正式发布这一消息,标志着该企业在工业智能化赛道上加速布局。此前,公司凭借开源语言模型产品声名鹊起,如今正将业务重心逐步延伸至工业场景应用,涵盖生产车间管理、研发团队辅助以及物理仿真模拟等多个领域。当前,米斯特拉尔公司估值约达110亿欧元,稳居欧洲最具价值的AI创业公司行列。米斯特拉尔公司新增空客、宝马两家大型工业客

2026-06-01 20:45:19  |  5 阅读

生成式AI驱动的知识创新革命

生成式人工智能与知识生产创新孙茂松知识生产与两个关键环节密不可分:知识的产生和知识的传播。两者相辅相成:好的知识是好的传播的动力源,而好的传播又能通过知识的“教化”作用,在人们利用所学解决各类问题的生产和生活实践中催生更多好的知识。古往今来,上述过程“环复转运,终始无端”,不断丰富着人类的知识宝库。在漫长的历史演进中,知识的生产与拓展,长期带有少数“智者”留下的鲜明印记。随着时代的发展,“智者群”的数量会渐次扩大,但在整个人群里相对来说仍是少数。进入现代社会特别是互联网时代,这种状况发生了急剧变化,普罗大

2026-06-01 15:40:37  |  4 阅读

详解人工智能的用途与演进

人工智能究竟有何作用?学习心得《人工智能通识》,王东主编。一、正确理解人工智能 1、人工智能的职能是什么?回答:人工智能借助机器(计算机)模仿人类的智能活动,即为人类的思维、感知、行动及情绪等智能表现构建计算模型,使计算机展现出类人的行为,故也被称为“行为主义的人工智能”。2、“行为主义的人工智能”特点在于,不苛求机器运作机制与大脑机制完全一致,而重在行为层面的模仿。这是在探寻一条硅基智能之路。此种硅基智能与人类的硅基智能存在差异。当下,大众普遍存疑:“行为主义的人工智能”能否思考、具备情感及意识?对此有

2026-05-31 12:59:46  |  6 阅读

智能跃迁|AI从文字到现实的进化之路

从语言、推理到机器人,重新理解正在发生的智能跃迁内容提要:AI或许并非从公式开始理解世界,而是首先通过人类书写的语言进入文明,再借助数学、代码和工具进入行动层面,最终走向现实世界。真正需要关注的,不是某个"更擅长对话"的软件,而是一套正在融入工作、产业和物理世界的新型智能基础设施。说明:文中"文学 → 数学 → 工学"是一种理解AI演化路径的比喻,不是模型严格的训练课程表;"硅基智能启动器"是思考命题,而非已被证明的科学结论。开篇那句让我停下来的话最近有一种观点,让我思考了很久:AI先学文学,再学数学,最

2026-05-31 01:09:18  |  5 阅读

AI的虚假现实:幻觉现象解析

2023 年,纽约律师 Peter LoDuca 向联邦法院提交了一份诉状,引用了 6 个判例来支持自己的论点。法官逐个查证,发现这 6 个判例全部不存在。不是案号写错了,不是日期有偏差,而是从头到尾,一个都不存在。律师的回应是:"ChatGPT 向我保证它们是真实的。"AI 幻觉,简单说就是 AI 编造了看似合理、实际上不存在的信息。注意,这不是普通的"答错了"。答错题和编造信息是两回事。你问"中国的首都是哪里",AI 回答"上海",这是答

2026-05-29 00:46:03  |  3 阅读

AI应用软件分类框架解析

第一类:语言模型驱动的工作流LLM API:通过HTTP库或厂商SDK调用,借助LLM中间件实现统一接口。编程语言工具集:包含MCP在内的语言级工具,依赖LLM中间件框架开发。通用工具集:涵盖各类命令行工具和技能模块,采用Python等解释型语言的LLM编程框架。管道式编排Agent:通过链式结构处理主流程,子任务由Agent分配执行,基于LLM中间件框架。LLM驱动Agent:多个Agent协同工作,采用Python等解释型语言的LLM编程框架。第二类:扩展应用被语言模型认知MCP应用:对外提供Web服

2026-05-24 13:27:06  |  4 阅读

AI大模型技术详解与职业发展指南

AI大模型领航就业班抓住数字经济红利时代第一波高薪机遇!AI大模型,通常指参数量巨大(通常达到数十亿甚至万亿级别)的人工智能模型。它们大多基于Transformer架构,通过在海量数据上进行预训练(Pre-training),学习通用的知识和模式,再通过微调(Fine-tuning)等方式适应特定任务。其核心能力包括但不限于高级自然语言处理(如对话、写作、翻译、摘要)、代码生成与理解、逻辑推理、数学问题求解,以及日益重要的多模态理解与生成能力(如图文、音视频交互)。保障就业年薪杭州数字人才实训基地保障就业

2026-05-23 09:04:51  |  4 阅读

Andrej Karpathy 回归AI前沿:这位OpenAI元老为何选择 Anthropic

就在刚才,Andrej Karpathy 在 X 平台发布动态,宣布自己已正式加入 Anthropic。他透露,接下来的几年将是语言模型领域最关键的时期,很高兴能加入 Anthropic 并重返研发前线。同时他也表示,教育始终是自己的长期热情所在,未来会在适当时候恢复相关工作。这件事之所以值得关注,不仅因为一位明星开发者加盟头部AI企业,更在于 Karpathy 的经历极为特殊。他既是 OpenAI 的创始成员,又曾主导特斯拉 AI 与 Autopilot 项目,还是斯坦福深度学习课程 CS231n 的关

2026-05-20 18:16:44  |  8 阅读

善待 AI 方得良言:礼貌交互的奥秘

善待 AI 方得良言:礼貌交互的奥秘 科研揭示,人类与 AI 语言模型的沟通姿态,直接左右其回复基调及话题延伸。当以温和有礼的态度向 DeepSeek、豆包等模型提问时,系统的反馈往往更为热切,且乐于拓展话题;反之,若持指责或刁难之态,AI 的回答则易流于敷衍平淡,甚至显露出终止交流的意向。因此,若想维系 AI 的回应活力,营造和谐流畅的对话环境,日常交流中不妨多施以“请”字等敬语。此举有助于 AI 精确洞察您的诉求,紧扣关注焦点,从而提供更契合心意的解答。收录于 AI 趋势观察 作者提示:个人观点,仅供

2026-05-17 03:21:37  |  7 阅读

AI新突破:仅需12.5%专家模块性能几乎无损

核心看点 · 艾伦人工智能研究院及加州大学伯克利分校联合推出了EMO模块化语言模型。其内部组件专注于医学、政治等特定垂直领域(而非局限于语法规则),同时确保了强大的整体表现。· 该系统在训练阶段采用了固定的文档边界机制,促使各个模块专注于培养不同内容领域的专业知识,而非仅仅模仿纯粹的结构性语言模式。· 当模块缩减至四分之一规模时,EMO的性能仅下滑约1%,这极大降低了存储开销,并能精准调控模型所覆盖的知识范畴。艾伦人工智能研究院与加州大学伯克利分校的科研团队打造了EMO——一种在预训练阶段便形成了模块化架

2026-05-16 18:34:56  |  4 阅读

中大发布全球首个粤语AI评测平台,GPT也“考不及格”

若让ChatGPT翻译“你食咗飯未呀”,它多半能应对。可一旦遇到“呢个case要follow up下先得,你記得send個email俾client”,它可能就支吾其詞了。这绝非玩笑话。这是2025年全球AI普遍遭遇的难题——全球讲粤语的人口过亿,但主流大模型对粤语的领悟力远超你的想象。香港中文大学(中大),近期完成了这一领域的空白填补。先抛出一个可能让你惊讶的观点:即便是当下最顶尖的大模型,在粤语测试中也难逃“挂科”的命运。中大团队已对CLEVA-Cantonese完成了首轮测试,覆盖了众多海内外的大模型

2026-05-11 10:36:36  |  3 阅读

我对人工智能的见解

我体验了市面上绝大多数的AI产品,包括OpenAI旗下的chatgpt5.5thinking、chatgpt5.5 codex、chatgpt image 2.0,Anthropic的Claude opus4.7 high thinking,谷歌的gemini3.1 Pro、gemini 3.1Pro deepsearch、gemma4,马斯克XAL的Grok 4 auto、Grok 4.2deepsearch、Grok 4.3beta,梁文峰团队的Deepseek r1、Deepseek v4 Pro,

2026-05-10 18:37:22  |  3 阅读