AI音乐浪潮来袭:行业格局如何重塑?
■AI正在取代的并非创作本身,而是技术门槛较低、可规模化生产的任务,例如短视频配乐、商业广告等功能性音乐
■在音乐创作中,真挚的情感与独特经历才是人类表达的根基。AI往往显得墨守成规,而真人演绎时偶尔流露的瑕疵——恰恰是最具生命力的部分
■从平台角度审视,AI持续推动行业进步、完善生态体系,使众多缺乏专业音乐创作背景的人也能产出水准以上的作品,反向激励专业创作者不断提升,产出超越AI水平的佳作
AI音乐正以惊人态势涌入市场。统计表明,2025年,仅Suno这一创作工具,用户每日生成的歌曲数量就突破700万首,相当于两周内产出近亿首歌曲,规模相当可观。
创作的门槛正以前所未有的速度降低。前不久,谷歌在其拥有数亿用户的产品Gemini中推出了音乐生成功能:仅需一句话、一张图片,数十秒便能输出一段完整音乐。去年末,腾讯音乐旗下的AI创作平台"VEMUS未音"正式亮相,核心定位是让零基础用户也能轻松创作歌曲。
在这波AI音乐浪潮中,众多作品被打上"AI痕迹明显""制作粗糙"的印记,但也不乏一些令人难辨真伪的佳作,甚至在某些人看来比真人演绎更具韵味。当人类与AI的听觉体验日益趋同,音乐制作行业将面临怎样的冲击?
在传统音乐创作产业链条上,生成式AI的影响并非"均衡分布"。
首当其冲的,是那些为平台批量生产歌曲的作词、编曲岗位。"Suno这类平台确实非同凡响,效率远超许多词曲作者。"广东某唱片公司的音乐制作人Rey表示。他提到的Suno,是目前全球最热门的AI音乐生成平台之一。用户只需输入简短的歌词和风格提示,几十秒就能生成一首涵盖人声、旋律、编曲的完整歌曲。"我认识的一些词曲作者,有的返乡了,有的转行学其他技能了。"
音乐制作人莫芷铭身旁也有人因此失业。他洞察到这背后创作模式的转变——以往一个公司要制作10首歌,需要5位编曲师,每人负责两首。如今,公司用Suno10分钟就能生成10首,快速筛选出两首有潜力的,再让人进行模仿和完善。"原本5个人的工作量,现在两个人就能完成。"
但产业链并非全面遇冷,部分工种反而展现出一定的韧性。比如混音。这是将多轨音频通过专业处理,融合成富有层次和空间感的最终成品的环节。"实际上混音市场反而更活跃了,有些人甚至转行去做混音。"Rey解释说,由于AI混音技术尚不成熟,在词曲价格普遍下滑的背景下,制作公司更愿意在仍需人工精雕细琢的混音环节加大投入。
混音为何能坚守阵地?Cashmere Studios是一家坐落于上海静安区的专业音频制作工作室,主理人卡卡指出,混音涉及极度主观的感性判断,难以被算法完全量化。"客户寻找混音师,犹如买衣服时请教闺蜜,需要的是带有个人审美和情感倾向的建议,而非标准化的技术输出。"
从技术层面分析,混音环节尚未出现强有力的AI工具,其核心障碍在于数据壁垒。"大量历史数据难以获取,比如某些专业软件的混音插件、硬件设备的具体操作参数,第三方很难批量采集,整个混音过程类似于一个'黑箱'。"卡卡解释。也就是说,要训练一个能比肩顶级混音师的AI,需要海量、高质量且开放的操作数据,目前难以实现。
采访中,几名音乐人对AI的共识是:它正在淘汰的不是创作本身,而是技术含量较低、可批量复制的工作,比如用于短视频配乐、商业广告等功能性音乐。按照AI当前的技术水平,生成的歌曲如同大众脸谱,工整、合格,但缺乏辨识度与灵魂。而市场对这部分内容的需求,正在被AI高效满足。
卡卡表示,近两年一些独立音乐人的收入来源明显缩水。"因为与企业合作的商单减少了,比如企业内部活动歌曲制作,企业改为直接使用AI软件生成。"Cashmere Studios自身的业务结构也在发生变化,与影视、游戏公司的合作也有一定程度的收缩。"以往大多数公司会采购一些版权音乐,或找乐手合作进行演奏尝试,现在越来越多公司直接借助AI寻找灵感、制作小样。"
技术跃迁的速度,决定着行业震荡的程度。资深玩家正在进化。Suno V5付费使用的Suno Studio专业模式,能实现对生成歌曲的精细化调整。用户能在不影响其他部分的情况下,重新生成歌曲的特定片段,无论是主歌、副歌还是桥段。同时,模型支持一键拆分最多12条原始音轨,可精准提取生成音频中吉他、鼓、贝斯、合成器等多种乐器轨道。这大大方便了音乐工作者,无论是二次编曲,还是后期混音,都能直接应用,效率倍增。
更大的变量,在于平台方的入局。今年2月,谷歌宣布其Gemini应用正式集成DeepMind旗下音乐生成模型Lyria 3。用户可以"描述一个想法",指定某种风格、情绪或节奏,模型就能自动生成歌曲;用户也可以上传照片或视频,Lyria 3会通过分析画面氛围,创作出契合场景的配乐。所有生成的曲目都使用SynthID技术添加了不易察觉的水印,便于检测AI创作内容。
谷歌之外,国内音乐平台也未缺席这场竞赛。比如,QQ音乐内嵌"AI作歌"功能,用户可搜索直达,提供"一句话""填词""图片""哼唱"等生成方式。"这类用户有自我表达的诉求,就像过去写日记、拍照一样,音乐也成了他们的一种记录方式。"腾讯音乐VEMUS未音业务负责人Lillian说。
去年年底,腾讯音乐旗下AI创作工具"VEMUS未音"正式发布,定位与Suno形成微妙错位——Suno逐渐向专业生产者倾斜,而VEMUS希望降低音乐创作门槛,让更多人有机会用音乐进行自我表达。"很多用户内心想写歌,但不太会定义风格,就像现在很多人不太会问AI问题一样。"Lillian说。为此,VEMUS给用户做了更简单的设计:用户可以参考自己常听的歌曲,让模型从中提取风格灵感。系统会总结当前热点的风格配方,一键调配,甚至可以通过对话的方式,聊着聊着就作出一首歌。
随着AI工具的"狂飙",有人被迫出局,也有人奋力追赶。莫芷铭将AI用作灵感催化剂,"如果自己要创作一首歌,能想到的元素肯定没有AI多,速度也没有AI快,那就让它生成五六个版本,来刺激我的大脑。"而Rey选择深入技术的腹地,研究如何"跑本地模型"。从电力系统专业出身,到转行做音乐,再到如今研究代码,他一直没有停下。
当AI生成的海量作品试图流向市场换取回报时,它们会撞上一堵墙——一套尚未适配、仍在重构的收益规则。
曾经,AI音乐在国内平台基本处于零分成状态。现实正在发生变化:部分平台已开始试水AI音乐商业分配。比如,网易云音乐推出AI歌曲专属激励金活动,符合要求的AI作品可参与收益分配;抖音旗下汽水音乐则依托短视频生态,为AI音乐提供播放收益与BGM使用分成。
即便如此,AI音乐的商业化仍面临双重困境:一是版权与收益规则不清,二是内容质量参差不齐。
业内人士解释,现有的商业模式、合作协议、版权授权机制,都是基于传统音乐创作模式建立的。AI音乐的出现,打破了这一体系。同时,内容质量也是绕不开的门槛。大量AI生成的歌曲仍带有明显的机器味,难以与真人作品竞争主流商业市场。
实际上,AI音乐能不能赚钱这个问题,不只在于规则制定。莫芷铭提出疑问:"如果一首歌明显是百分之百AI生成的,为什么要分成?"
在海外,甚至有平台明确对AI音乐说"不"。今年1月,知名独立音乐平台Bandcamp宣布,禁止AI生成的音乐上架,还规定"完全或主要由AI生成的音乐和音频"不允许发布,任何使用AI工具模仿其他艺术家或风格的行为也被严格禁止。Bandcamp在声明中强调,此举是为了保护真实的人类创作者社群,让乐迷能够确信他们在平台上听到的音乐"是由人类创作的"。
争议之下,行业并未停下脚步。尽管AI音乐收益机制尚不成熟,仍有不少机构和创作者在持续布局AI音乐,部分作品进入热门榜单,还有平台已经捧出了自己的AI音乐人。为什么?
"这背后有几个驱动因素。"Lillian分析,一是占位,很多公司或个人认为AI音乐是未来方向,提前布局,尝试跑出爆款;二是内容试验,有些人用AI生成大量歌曲,测试用户反馈,甚至有些作品质量不错;三是自我表达,普通用户用AI工具创作音乐,更多是情感记录或社交分享,而非商业目的。
与此同时,AI音乐的普及也带来"洗歌""刷量"等滥用行为。对此,平台也在不断升级技术能力,来识别和治理低质量、侵权内容。
"我们正在观察用户的选择和行业的发展。如果AI音乐足够优质,能够被用户喜爱,它自然会进入榜单。未来,我们也可能为AI音乐设立专属榜单,甚至探索新的广告模式、商业化路径。"Lillian说。
这场AI对音乐行业的重塑,正触及一个更深层的结构性问题——职业阶梯的断裂。
卡卡观察到:"AI可能会导致严重的人才断档。"过去,音乐人可以从接小型项目、写定制化的商业歌曲起步,慢慢积累经验爬升到金字塔顶端。但现在,这些"练手级"的机会正在被AI生成的音乐大规模蚕食。"成为专家的那条路径变窄了,很多人开始考虑转行,或者加入AI音乐制作的大军。"
这意味着,未来的音乐行业可能呈现出哑铃型结构——一端是拥有个人IP和不可替代审美的少数人,另一端是使用AI工具批量生产的人,而中间层的生存空间正被急剧压缩。站在平台视角,Lillian则认为,AI在不断推动行业发展、优化行业生态,让大量过去没有专业音乐创作能力的人也能创作出还不错的音乐,也反推更多专业从业者去产出比AI创作更好的音乐作品和内容。
这两种观察并非矛盾,而是同一枚硬币的两面:传统的职业中间层或许在缩小,但一个由AI赋能的新手和跨界者构成的大众创作中间层正在出现。这背后,指向专业从业者角色的深刻迁移——从"如何做"的执行者,被推向"做什么、为什么做"的决策者。审美、情感和独立品格,正在成为更稀缺的核心能力。正如硅谷著名天使投资人纳瓦尔在一档播客中所言,AI没有肉身,没有欲望,没有生存本能,本质上依然是"人类知识压缩机和模仿者"。
"在歌曲领域,真实的表达来自人类的情感与经历。AI时常表现得循规蹈矩,而真人演绎时不免会有一些小瑕疵——而那些瑕疵背后,是很鲜活的东西。"卡卡说。
一个明显的趋势是,越强调人的连接性的工种,抗风险能力越强。
身兼多职的音乐人莫芷铭在采访中展现得很从容,他的主要精力放在需要深度沟通的专辑制作和艺人演唱会演出上,这类工作高度依赖个性化沟通。"艺人有明确的表达意图,音乐需要与现场的视频、灯光、特效以及很多工种紧密协作。像Suno这类工具,目前还处理不了如此细致、综合的创作需求。"
卡卡决定将工作室的未来方向锚定在"人与人的深度交流"上,计划打造更大的公共活动空间。"当套路化音乐充斥市场,人们过度沉浸在虚拟世界中,'物极必反'的规律将会生效。"他依然希望,大家能回归真实的、面对面的线下沟通。(记者 束涵 见习记者 余敏之)
