Nightshade用向图像“投毒”的方法以阻止AI训练并帮助保护艺术家

周五,芝加哥大学的研究团队发布了一篇研究论文,描述了"Nightshade"这一数据投毒技术。该技术旨在破坏AI模型的训练过程,MIT Technology Review和VentureBeat对此进行了报道。其目标是帮助视觉艺术家和出版商防止其作品被用于训练如Midjourney、DALL-E 3和Stable Diffusion等生成性AI图像合成模型。

芝加哥大学称其为"毒药"的开源工具能够在对人类不可见的方式下修改图像,进而破坏AI模型的训练。许多图像合成模型主要使用从互联网抓取的图像数据集,这些数据集可能包含未经艺术家许可的受版权保护的材料。OpenAI从Shutterstock获取了其DALL-E训练图像的一部分许可。

AI研究者们依赖于从互联网抓取的数据,这一做法被许多人视为伦理上的难题。为了创建Stable Diffusion这样的模型,需要整个互联网的图像及其注释,这样才能构建一个具有足够多样性的数据集。从成本和时间上看,为数亿图像进行注释是不现实的。拥有大型图像数据库的公司,如Getty和Shutterstock,在使用经过许可的训练数据时具有优势。

Nightshade用向图像“投毒”的方法以阻止AI训练并帮助保护艺术家

加利福尼亚大学伯克利分校图书馆等研究机构主张,为研究和教育目的,应将AI训练中的数据抓取视为合理使用。这一做法还未得到美国法院的明确裁决,而监管机构正在就相关立法征求意见。但Nightshade团队认为,研究和商业用途完全不同,他们希望他们的技术能迫使AI训练公司获得图像数据的许可、遵循爬虫限制并尊重退出请求。

芝加哥大学教授Ben Y. Zhao表示:“这个工具的意义在于为模型训练者和内容创作者之间提供一个平衡。目前,模型训练者完全占据上风。目前能够限制爬虫的手段只有退出列表和不爬取的指令,这些都是基于AI公司的自觉,而且没有可验证或可执行的手段。此工具是首个让内容所有者能对未经授权的模型训练产生实质性影响的工具。”

Shawn Shan、Wenxin Ding、Josephine Passananti、Haitao Zheng和Zhao在芝加哥大学计算机科学系合作开发了Nightshade。该工具是基于他们之前的Glaze工作,Glaze是一个能够以方式修改数字艺术品来混淆AI的工具。而Nightshade则更进一步,通过破坏训练数据来混淆AI。例如,研究者使用此工具修改了狗的图像,使AI模型在试图生成狗的图像时,却生成了猫。Nightshade会微妙地修改图像,使其对人类看起来依然是原图,但在AI模型中,该图像同时包含原始概念和投毒概念,这使得基于这些数据的模型训练出现误差。

研究者使用开源的Stable Diffusion模型测试了此工具。当模型处理了50个被投毒的图像后,它开始生成带有扭曲特征的狗的图像。当处理了100个样本后,模型生成了猫而非狗。到了300个样本,生成的猫图像近乎完美。如VentureBeat所述,由于生成型AI模型的工作原理,Nightshade还能够使模型在接收到与“husky”、“puppy”和“wolf”等词汇相关的提示时,生成猫的图像。

Nightshade用向图像“投毒”的方法以阻止AI训练并帮助保护艺术家

抵御Nightshade数据投毒技术可能对AI开发者来说是一个挑战。这些改变的像素不易被人眼检测,甚至对软件数据抓取工具来说也难以识别。所有已被用于训练的被投毒图像需要被检测并移除,受影响的AI模型可能也需重新训练。

尽管芝加哥大学的研究人员承认他们的工具可能被恶意使用,他们强调主要目标是重新平衡艺术家的权力。Glaze项目团队在社交平台X上通过一系列帖子详细阐述了Nightshade的目标,强调了“AI公司与内容所有者之间荒谬的权力不对称”。此外,赵在他的账户上写道:“Nightshade的目的不是破坏模型,而是阻止未经授权的数据训练,并鼓励使用合法授权内容进行训练。对于遵守退出选项并不进行数据抓取的模型,影响微乎其微或不存在。”

像Nightshade这样的技术发展可能引发一场研究人员间的竞赛,一方旨在保护人类创造性作品免受AI吸收,另一方则寻求满足其数据饥渴的模型。资源更丰富的大公司最终可能能够找到对策来应对Nightshade,但预算较低的小公司和开源项目可能会受到更大的影响。

即便如此,对于一些艺术家来说,没有他们的许可,任何人都不应使用他们的作品来训练AI模型。当周一Nightshade的消息传开后,一些直言不讳的艺术家开始在社交媒体上公开庆幸新工具的潜力。一位名为Katria Raden的插画家在X平台上发帖说:“AI界的人士听说了这一消息,他们很沮丧……他们之前是怎么对我们说的?‘适应或死亡’?‘你不能阻止技术进步’吗?”这引发了一系列支持和反对AI的激烈讨论。

值得注意的是,公司和研究人员早就抓取了未经投毒的艺术作品,因此对他们已下载到设备上的内容(或现有AI图像生成器)来说,已无法产生影响。然而,如果Nightshade技术被广泛使用——且若没有新技术迅速击败它——那么未来吸收新的艺术风格和记录当前事件的摄影作品可能会受到影响。

#免责声明#

①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!

④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!

给TA打赏
共{{data.count}}人
人已打赏
生活杂谈

iPhone15Pro系列满意度创新低

2023-10-25 0:00:00

生活杂谈

康纳斯博士的实验室里都藏了什么宝贝?

2023-10-27 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索