4月24日星期五,一份简短的 .wav 文件被上传到了美国专利商标局(USPTO)的数据库中。这既不是一首歌,也不是用于电台播放的宣传剪辑,而是一段由 Taylor Swift 本人录制的音频,内容只有三个词——“Hey, it’s Taylor”。通过提交这段音频片段,Swift 的控股公司 TAS Rights Management 正试图完成一项跨越传统品牌保护与生物识别安全新现实的尝试:她试图将自己声带发出的特定共鸣转化为受联邦保护的商业商标。
这并非虚荣之举,而是一种针对工业级问题的防御性堡垒。随着生成式 AI 模型在仅需数秒训练数据的情况下即可愈发熟练地克隆人声,保护个人身份的法律框架已显得力不从心。Swift 申请注册其声音及特定视觉形象(身穿彩色连体衣、脚蹬银色长靴,手持粉色吉他)的商标,表明版权法已不足以成为抵御合成潮流的盾牌。
声音可以成为品牌吗?
此处的科技矛盾在于版权与商标的区别。版权保护的是特定的“作品”——一首歌、一本书或一张照片,但它并不保护创作者本人的风格、音色或身份。如果一个 AI 生成了一首听起来与 Taylor Swift 一模一样但旋律和歌词全新的歌曲,版权律师往往会陷入困境。商标法提供了另一条路径:它保护的是产品的来源。通过将自己的声音注册为商标,Swift 认为她的声色是其品牌的“来源标识符”,就像米高梅狮子的咆哮或英特尔的提示音一样。
包括 Josh Gerben 在内的知识产权律师指出,这代表了一种根本性的转变。这是从针对 AI 输出内容的诉讼向针对用于销售 AI 的身份标识的诉讼转变。这些申请旨在打击“AI 生成的片段或未经授权的使用”,力求为 Swift 的团队提供一柄清晰的联邦重锤,以打击那些托管深度伪造(deepfake)内容的平台。这是一种试图以对待企业商标同样的法律严苛度来对待人类声音的尝试。
自愿保障机制的失败
在特朗普相关的事件中,这项技术被用于制造虚假背书——这是对名人形象商业和政治价值的直接攻击。在美国,“公开权”(Right of Publicity)法律在不同州之间存在巨大差异,加利福尼亚州、田纳西州和纽约州各有不同。通过进入联邦商标法的领域,Swift 的法律团队正寻求建立一个统一的全国性标准,而不再依赖各州立法机构的意愿或社交媒体巨头不一致的服务条款。
欧洲如何看待这场生物识别“圈地运动”
当 Swift 在美国专利局进行抗争时,欧洲的视角提供了一种截然不同的监管路径。根据目前正在各成员国逐步落实的《欧盟人工智能法案》(EU AI Act),针对“高风险”AI 和通用模型有明确的透明度义务。该法案第 52 条规定,使用 AI 系统生成或操纵与现有人员极其相似的图像、音频或视频内容(即俗称的深度伪造)的用户,必须披露该内容是人工生成的。
在德国,《一般人格权》(allgemeines Persönlichkeitsrecht)的概念深深植根于宪法之中。与美国同行相比,德国法院在保护个人控制其自身形象和声音的权利方面历来更为严苛。然而,德国法律体系与欧盟其他地区一样,目前正深陷 AI 的管辖权噩梦中:如果一个模型是在都柏林的集群上训练的,使用的数据是从新加坡的服务器上抓取的,并由慕尼黑的用户部署,那么“人格权”将变得难以执行。布鲁塞尔押注的是对模型提供商本身进行自上而下的监管,而 Swift 所完善的美国式方案,则是赋予个人足够的私有财产权,以便起诉供应链中的所有人。
训练数据的瓶颈
法律文件背后隐藏着更深层的技术不满:训练数据的来源。像 Suno、Udio 或 Voicebox 这样的 AI 模型并非凭空创造声音;它们需要海量的人类语音数据集。为了模仿 Taylor Swift,AI 必须首先“消化”数千小时的 Taylor Swift 录音资料。业内工程师都清楚,目前这批大型语言模型(LLM)和音频扩散模型的构建,均是基于“互联网上公开的一切皆可视为‘合理使用’用于训练”这一假设。
从某种意义上说,Swift 试图将其声音注册为商标,是对这些训练数据的一种追溯性征税。如果她的声音是注册商标,那么任何能够明确复制该声音的 AI 模型,仅凭其作为商业产品存在这一事实,就可能构成了对其商标的侵权。这为提供这些模型基础设施的硬件和软件公司带来了潜在的责任风险。冲突的焦点从在卧室里制作深度伪造的青少年,转移到了硅谷拥有风险投资的 AI 实验室以及驱动它们的 GPU 集群上。
法律与延迟之间的鸿沟
尽管商标申请具有战略上的高明之处,但在法律保护与技术现实之间仍存在巨大的鸿沟。商标赋予了你起诉的权利,但并不能让你在病毒式传播的视频达到千万播放量之前将其阻止。法律系统的延迟以月和年计,而深度伪造视频的病毒式传播延迟仅以秒计。这就是工程师和政策制定者正在努力调和的现实。
即使 USPTO 批准了这些商标,其执行可能仍需要一种新型的“数字指纹”或水印技术——这些技术尚处于起步阶段,且极易被复杂的操作者绕过。据报道,Matthew McConaughey 也采取了类似的策略,这表明我们正在目睹一场由名人引领的数字公地圈地运动的开端。其目标是让未经授权使用人类形象的法律成本变得足够高,从而迫使 AI 开发者建立“选择加入”(opt-in)系统,而不是目前流行的“先抓取,后询问”模式。
归根结底,Swift 正在做她一直以来所做的事:将她的艺术和身份视为一种工业资产,并用尽可能高的围墙加以保护。她拥有律师,布鲁塞尔拥有指令,而 AI 抓取者拥有数据。在一个日益重视合成内容胜过真实内容的数字经济中,这些力量中哪一种会被证明更为持久,还有待观察。目前,那个 .wav 文件仍静静地躺在 USPTO 的数据库中——这是生成式 AI 时代荒野中一个微小的数字界桩。
USPTO 现在将决定人类的声音是否可以成为一个品牌。这或许是在弗吉尼亚州作出的决定,但其涟漪将从库比蒂诺到柏林的每一个董事会中被感受到。
Comments
No comments yet. Be the first!