贝多芬去世近 200 年后,一个由音乐家和计算机科学家组成的团队创造了一种生成人工智能 (AI),它如此令人信服地完成了他的《第十交响曲》,以至于音乐学者无法区分音乐是来自人工智能还是作曲家的手写笔记。
在这些人工智能工具能够生成新类型的数据(包括歌曲)之前,它们需要使用大量相同类型的数据进行训练。创建生成式人工智能模型的公司通常会从互联网上收集这些训练数据,通常是从艺术家自己提供艺术作品的网站上收集。
“网络上的优质艺术作品大多都有版权,但这些公司可以很容易地获得版权版本,”Min H. Kao 电气工程与计算机科学系(EE)专门研究网络安全和机器学习的助理教授刘健说。
“也许他们像普通用户一样,为歌曲支付 5 美元,并且拥有完整版本。但这次购买只给予他们个人许可;他们无权将歌曲用于商业化。”
公司通常会忽略这一限制,用受版权保护的作品训练他们的人工智能模型。毫无戒心的用户为生成工具付费后,可能会生成听起来与受版权保护的人造原创歌曲极为相似的新歌曲。
今年夏天,田纳西州成为美国第一个通过法律保护音乐艺术家的声音免遭未经授权的生成式人工智能使用的州。刘先生对这一第一步表示赞赏,但他认为有必要走得更远——不仅要保护人声曲目,还要保护整首歌曲。
刘博士与他的博士生 Syed Irfan Ali Meerza 和利哈伊大学的 Lichao Sun 合作开发了 HarmonyCloak,这是一个新程序,它使音乐文件基本上无法被生成式人工智能模型学习,而不会改变它们在人类听众听来的声音。他们将在2025 年 5 月举行的第 46 届 IEEE 安全与隐私研讨会 (S&P)上展示他们的研究成果。
他说道:“我们的研究不仅解决了创意社区的迫切担忧,而且还为维护人工智能时代艺术表达的完整性提出了切实可行的解决方案。”