科技的发展往往伴随着与道德和法律之间日益频繁的碰撞。这种碰撞不仅考验着科技本身的发展方向,更在不断地挑战着我们对传统道德观念和法律制度的认知。
随着大型语言模型(LLM)技术的日益精进,科技巨头们在数据使用方面也受到了道德和法律界限的拷问。近日,科技巨头Meta(前身为Facebook)因使用含有盗版内容的“Books3”数据集训练其LLAM模型而陷入版权纠纷的漩涡。
据悉,Books3数据集由AI研究者Shawn Presser于2020年创建,涵盖了19.5万本图书,总量近37GB,旨在助力机器学习领域的进步。然而,该数据集在构建过程中涉嫌从盗版网站Bibliotik大量爬取受版权保护的作品,这一行为如今成为争议的焦点。
作家Richard Kadrey等一众创作者已对Meta提起集体诉讼,指控其侵犯版权。他们谴责Meta不仅使用了含有盗版内容的Books3数据集,还拒绝向原作者支付任何形式的补偿。
对此,Meta方面承认曾利用Books3数据集进行模型训练,但坚称其行为属于“合理使用”,并未侵犯任何版权。公司发言人表示,在当前的AI研发环境中,完全避免使用受版权保护的材料几乎是不可能的,且公司并无故意侵权的意图。
然而,这一说法并未平息众怒。此前,《纽约时报》也曾因类似原因对OpenAI和微软提起诉讼,指控其使用报纸文章训练聊天机器人ChatGPT。这些文章是其宝贵的资产,凝聚了记者和编辑们的辛勤工作与创意,应当享有相应的版权保护。OpenAI同样以“合理使用”为由进行辩护,他们认为,使用公开的互联网材料来训练人工智能模型是合理的,且在当前的技术环境下,完全避免使用受版权保护的材料几乎是不可能的。因此,他们主张自己的行为属于“合理使用”范畴,并未侵犯《纽约时报》的版权,并要求法院驳回诉讼。
值得注意的是,Books3数据集中的部分内容来自盗版网站Bibliotik,这一事实使得整个事件更加复杂。2023年,丹麦反盗版组织Rights Alliance已要求下架该数据集,并对其施加了数字存档禁令。
随着AI技术的不断进步,数据使用与版权保护之间的冲突愈发激烈。此次Meta面临的集体诉讼无疑为整个行业敲响了警钟:在追求技术创新的同时,如何尊重和保护知识产权成为急需解决的问题。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!