高远的回答
话又说回来,作品被窃似乎是在 AIGC 爆火之前就一直存在的问题。那么我们不如换个思路:是否有可能使用 AI 来校验盗窃行为呢?
首先,作品窃取指的是盗窃「创意」或「风格」。在过去,这两者是很难被准确定义的,多数时候无法定义。但是,神经网络却做到了。神经网络可以通过升维或者降维,以及上百亿级别的参数量,通过激活函数组成的数字网络去捕获到作品的「创意」或「灵感」,并生成对应特征空间的向量。
总之,神经网络找到了一种方式,用数字去表示灵感或者创意。那么我们是否可以通过这些数字的相似度来甄别抄袭行为?我认为可能是可行的。
比如,你可以丢 2 篇文章给 GPT,并且咨询它:
1 文章是否抄袭了 2 文章?如果有,给出一个大概的抄袭比例,并且说明存在抄袭嫌疑的具体点。
AIGC 技术只是一种工具,用什么还是得看人。从技术潜力上,AIGC 技术能够成为人类辅助检测抄袭的手段。
当然,创作者也需要去方式 AIGC 带来的冲击,毕竟哪天被低成本抄袭就要丢饭碗了。我分享一些想到的切实可行的方法去应对这些冲击。
思路一、证明自己的工作量。这是一个区块链的思想,叫工作量证明,也可以用在创作工作中,比如:通过视频证明你是从头开始绘画的、灵感的来源、思路的整理、反复改稿的历史等等。在自媒体平台上,部分图像创作者已经开始把创作内容转向展示自己的创作过程上了。以此可以证明作品是原创的,而非 AI 生成的。
思路二、注入特殊内容。举个例子,word 文档凑数最简单的办法是什么?打一大堆无意义的话,并且字体设置为白色!同样的道理可以用于作品创作。以文章举例,作者可以加一大堆无意义的字,甚至是误导 AI 的文字,在文章的底部,并设置成白色(或者和背景相同的颜色)。人看不到,AI 看得到,AI 看到并学习了,就会把自己迭代成一个笨蛋!图像创作者应该也有对应的水印方法,或者加错误的 tag,比如把山的绘画 tag 成海,以此误导 AI。
总之,创作者可以挖坑给 AI。
最后,作品窃取问题其实隐含着一个更加深刻的哲学问题:“模仿一个人叫抄袭,模仿全人类还算抄袭嘛?”如果 AI 学习的数据集是千千万万个人的作品,而不是某个特定的作家,这还能叫抄袭么?
欢迎探讨~