内容创作者们正在联手维权,大家都在吵人工智能用数据是不是合法的事儿。最近,有个海外的视频博主起诉Snapchat母公司Snap Inc.,把AI训练数据合规的问题给闹大了。据报道,YouTube上的h3h3、MrShortGame Golf和Golfholics这些大博主,已经给美国法院递诉状了。他们控告Snapchat开发Imagine Lens这个功能时,偷偷用了别人的版权视频来训练模型。 原告方的说法是,Snapchat用来喂模型的那个HD-VILA-100M大数据库,本来是学校机构弄的,只允许做学术研究,不能拿出来赚钱。可Snapchat就硬把这数据用了,还把训练好的结果放进了面向全球用户的Imagine Lens里卖钱。原告认为这是明目张胆地违规,不仅破坏了协议的精神,还侵犯了他们的著作权。所以他们要法院让Snapchat赔钱,还得把永久性禁令发下来,不让他们继续用这套数据干商业的事儿。 这可不是孤立事件。自打生成式AI火了之后,光在美国就有七十多起类似的官司了。告的对象五花八门,从个人艺术家、作家,到大型新闻机构、音乐公司都有。大家争的核心就是:科技公司在用海量数据喂AI的时候,这数据到底是合法弄来的吗?有没有尊重版权方的限制? 这个案子特别的地方在于,它直接把“研究用途”和“商业用途”的模糊地带给捅破了。以前很多大数据库都是高校为了搞研究搞出来的,还开源了,但往往有严格的规矩。现在AI发展太快,从实验室跑到了产业里,有些公司可能就钻空子了。 这事儿也反映出数字时代创作者和平台公司的关系紧张得很。创作者觉得自己辛辛苦苦做的内容是互联网的宝藏,科技公司未经允许就拿来当燃料训练AI,这是一种新型剥削。而科技公司大多说自己是合理使用,是技术创新必须的环节。 这场官司的判决可能会给全球AI产业指明方向。它不光是为了赔钱或者禁止某个产品,还可能会定一个AI训练数据的边界规则。人工智能发展得再快也得有个谱儿才行。Snapchat跟内容创作者这架官司就是技术进步和权益保护碰撞的一个缩影。它告诉大家:AI不能以忽视创作者权益为代价。 未来咱们得立法、司法、科技公司、创作者和学术界一起想办法构建公平的数据使用机制。只有在尊重创新、遵守法律的前提下,人工智能才能走得稳当、长久地造福社会。