大型科技公司,如微软支持的OpenAI和谷歌一直在使用其他公司在线上所创作的内容,对他们的生成式AI模型进行训练,而无需征得特定许可,同时禁止使用自己的内容来训练其他AI模型。这引发了一场即将决定网络未来及如何在这个新世界中应用版权法的激烈法律争战。Reddit和其他公司正进行抵制,在Reddit中宣布计划开始收费提供其数据访问。OpenAI的CEO正在研究尊重版权的新AI模型,而一些出版商则敦促科技公司支付使用费来训练其AI模型。
Samuel Altman(OpenAI首席执行官)于2023年5月16日在华盛顿特区参加了美国参议院司法委员会隐私、技术与法律小组委员会的听证会。
在新一代生成式AI时代,大型科技公司在使用在线内容方面遵循着“说教而不践行”的策略。
微软支持的OpenAI、谷歌以及谷歌支持的Anthropic这些公司多年来一直在使用各个公司创作的在线内容训练他们的生成式AI模型。这是在没有明确请求许可的情况下进行的,它是一个正在酝酿中的法律战斗,将决定网络的未来以及如何在这个新世界中套用版权法。
科技行业可能会辩称他们的做法属于合理使用。这个问题尚未确定。然而,这些大型科技公司不会允许其他人使用自己的内容来训练其他AI模型。那么,为什么他们应该允许这样对待其他人呢?
看看Claude(Anthropic的AI助手)的服务条款:
“您不得以以下方式访问或使用服务,如果这些限制与可接受使用政策不一致或与之存在歧义,那么可接受使用政策为准:用于开发与我们的服务竞争的任何产品或服务, 包括开发或训练任何人工智能或机器学习算法或模型。”
这是谷歌生成式AI使用条款的一部分摘录:
“您不得使用服务来开发机器学习模型或相关技术。”
下面是OpenAI的使用条款中的相关部分。这是支持ChatGPT的公司。
“您不得……使用服务的输出来开发与OpenAI竞争的模型。”
这些公司并不愚蠢,但他们是伪善的
这些公司并不愚蠢。他们知道,优质的内容对于训练新的AI模型至关重要。所以,他们不允许自己的产出这样被使用是有道理的。
但是,为什么其他任何网站或公司会允许这些科技巨头自由地使用它们的内容来训练他们的模型呢?
周五,Insider向OpenAI、谷歌和Anthropic发表评论。截至发稿时,他们尚未回应。
Reddit等其他公司表示已经够了
其他公司刚刚开始意识到正在发生的事情,他们对此感到不满。多年来,Reddit一直被用于AI模型的训练,现在该公司计划开始收费,让用户访问其数据。
Reddit的首席执行官Steve Huffman表示:“Reddit的数据语料库非常有价值。但我们不需要免费将所有这些价值给一些世界上最大的公司。”
今年4月,埃隆·马斯克指责OpenAI的主要支持者微软非法使用Twitter的数据训练AI模型。他在推特上写道:“诉讼时刻到了。”
当被要求对此发表评论时,一位微软发言人在一封发给Insider的电子邮件中表示:“这个前提有很多问题,我甚至不知道从哪里开始。”
OpenAI的首席执行官Sam Altman正在努力对这个问题更加深思熟虑,研发更尊重版权的新型AI模型。“我们正在尝试开发新的模型,以便当AI系统使用您的内容,或者使用您的风格时,您可以获得相应的报酬。”最近,他在接受Axios采访时表示。
包括Insider在内的出版商在这里有既得利益。有些出版商,如新闻集团等,已经要求科技公司支付使用他们的内容训练AI模型的费用。
当前AI模型的训练方式破坏了网络
前微软高管Steven Sinofsky认为,目前AI模型的训练方式是错误的,它“破坏了”互联网。
他在推特上说:“过去,允许抓取数据是为了交换点击。但现在,抓取只是用来训练模型,而创作者/版权持有人永远得不到任何价值。”Insider请他发表评论,但周五他在旅行中无法回应。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!