标签

大语言模型背后的秘密

大语言模型(Large Language Model,简称LLM)如同一位通读了全网知识的超级学神,不仅能与人对话、撰写文章、翻译语言,还能编写代码——仿佛拥有一颗"超级大脑"!设想一下,若你能阅读全世界所有书籍、文章及网页,并能对任何提问给出精准答案——这正是大语言模型的工作方式。其三大要点:→ 接受了数千亿词汇(涵盖书籍、网页、对话等)的训练→ 犹如一个人读完了整座图书馆→ 核心机制很简单:"预测下一个词"→ 比如"今天天气真___",它猜测"好

2026-04-03 06:21:14  |  4 阅读

AI 的「词元」:Token 如何影响模型处理文本?

Token,直译为「词元」或「令牌」,是大语言模型(LLM)处理文本的基本单位。你输入的文字,在进入模型之前,会先经过一个叫做Tokenizer(分词器)的程序,把文本切碎成一个个 Token。这些 Token 再被转换为数字 ID,模型才能「读懂」它们。一个 Token ≠ 一个字。Token 可以是:目前主流的分词算法有三种:最常见的方法,被 GPT 系列、LLaMA、Mistral 等广泛使用。核心思想:从单个字节出发,反复合并出现频率最高的相邻字节对,直到达到预设词表大小。举例:Google BE

2026-04-02 21:44:51  |  5 阅读

人工智能金融优化:范式革新与技术重构

上海市社会科学界联合会主管主办摘要:人工智能技术和大语言模型在金融市场中的广泛应用,为解决传统金融优化问题提供了新机遇和载体,显著提升了金融建模和决策优化能力。本文基于金融行为最优化的核心逻辑,探讨了金融产品价格预测、投资组合管理、风险识别及监管手段的先进性等核心问题,对比传统金融方法与人工智能金融方法,揭示AI技术在金融优化中的范式革命和技术重构过程,总结其具体路径和创新,展现人工智能金融在优化问题中的优异表现。作者:殷德生,华东师范大学经济与管理学院、中国金融研究院教授;王涵,华东师范大学中国金融研究

2026-04-01 21:20:42  |  3 阅读

AI水印筛查拒497篇论文

编译 |徐锐近日,据《自然》报道,将于7月在韩国首尔举行的2026国际机器学习大会(ICML) “拒”了497篇论文,约占提交论文总数的2%,原因是这些论文的作者在对其他会议论文进行同行评审时,违反了人工智能(AI)的使用政策。ICML实行互评政策,除特殊情况外,每位向大会提交论文的作者都必须参与其他会议论文的评审。会议组织者在分发给评审人员的研究论文中隐藏了水印,以此检测违规使用AI的情况。违规使用大语言模型(LLM)生成同行评审内容的人,其论文会被大会拒绝。会议组织者介绍,水印添加了只有LLM才能识别

2026-03-30 10:14:41  |  7 阅读