Meta拿盗版书籍训练AI,还拒绝赔偿作者

科技的发展往往伴随着与道德和法律之间日益频繁的碰撞。这种碰撞不仅考验着科技本身的发展方向,更在不断地挑战着我们对传统道德观念和法律制度的认知。

随着大型语言模型(LLM)技术的日益精进,科技巨头们在数据使用方面也受到了道德和法律界限的拷问。近日,科技巨头Meta(前身为Facebook)因使用含有盗版内容的“Books3”数据集训练其LLAM模型而陷入版权纠纷的漩涡。

据悉,Books3数据集由AI研究者Shawn Presser于2020年创建,涵盖了19.5万本图书,总量近37GB,旨在助力机器学习领域的进步。然而,该数据集在构建过程中涉嫌从盗版网站Bibliotik大量爬取受版权保护的作品,这一行为如今成为争议的焦点。

Meta拿盗版书籍训练AI,还拒绝赔偿作者

作家Richard Kadrey等一众创作者已对Meta提起集体诉讼,指控其侵犯版权。他们谴责Meta不仅使用了含有盗版内容的Books3数据集,还拒绝向原作者支付任何形式的补偿。

对此,Meta方面承认曾利用Books3数据集进行模型训练,但坚称其行为属于“合理使用”,并未侵犯任何版权。公司发言人表示,在当前的AI研发环境中,完全避免使用受版权保护的材料几乎是不可能的,且公司并无故意侵权的意图。

然而,这一说法并未平息众怒。此前,《纽约时报》也曾因类似原因对OpenAI和微软提起诉讼,指控其使用报纸文章训练聊天机器人ChatGPT。这些文章是其宝贵的资产,凝聚了记者和编辑们的辛勤工作与创意,应当享有相应的版权保护。OpenAI同样以“合理使用”为由进行辩护,他们认为,使用公开的互联网材料来训练人工智能模型是合理的,且在当前的技术环境下,完全避免使用受版权保护的材料几乎是不可能的。因此,他们主张自己的行为属于“合理使用”范畴,并未侵犯《纽约时报》的版权,并要求法院驳回诉讼。

值得注意的是,Books3数据集中的部分内容来自盗版网站Bibliotik,这一事实使得整个事件更加复杂。2023年,丹麦反盗版组织Rights Alliance已要求下架该数据集,并对其施加了数字存档禁令。

随着AI技术的不断进步,数据使用与版权保护之间的冲突愈发激烈。此次Meta面临的集体诉讼无疑为整个行业敲响了警钟:在追求技术创新的同时,如何尊重和保护知识产权成为急需解决的问题。

#免责声明#

①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!

④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!

给TA打赏
共{{data.count}}人
人已打赏
生活杂谈

充满故事感的老克勒——奢华希尔顿酒店测评-上海外滩华尔道夫

2024-1-13 0:00:00

生活杂谈

PS5新手柄曝光,《最后生还者》第二季艾比扮演者确认!

2024-1-15 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索