“AI 绘画训练的数据集中暗含着 AI 绘画生成的密码。AI 是工具,ai绘画的作品是不是原创,关键看用工具的人有没有原创精神。我们可以让 AI 沦为 “抄袭” 的工具,也可以共同探索如何借助 AI 实现各行各业的想象力腾飞。
ai需要学习大量人类绘画作品,所以网上有很多有关ai绘画“抄袭”的说法,比如 “ai就是缝合怪”、“ai只是把人类艺术家的作品东拼西凑得到结果”。ai绘画到底学习了什么内容,ai作画是自己画的吗?ai绘画的作品是原创吗?本文就给大家一一解读。
58 亿图片数据 ~ 看看 AI 学了啥?
大家可能会好奇,都说 AI 学习了大量图片数据后拥有现在的生成能力,那 AI 都学了啥呢?以时下最流行的开源绘画 AI —— Stable Diffusion 为例,其训练的数据集是 LAION-5B,这个数据库拥有从互联网上抓取的 58 亿「图像-文本」数据,里面暗含着 AI 绘画生成的密码。
1、SD 最好用英文描述生成图片
LAION-5B 包含 23 亿英文描述数据,22 亿其他 100+ 语言描述和 10 亿不好区分语言(比如姓名)的数据。很自然的,AI 看的越多,生成效果越好。
2、SD 生成 512X512 图片效果最好
SD 在 LAION-5B 数据库子集的 512x512 图像上训练,所以生成 512x512 的图像效果较好。
3、SD 包含着互联网的偏见
比如搜 nurse(护士),全是女性护士;搜 asian(亚洲人),充斥的都是色情照片。不要因此责备 AI,它只是如实反映了(西方)互联网对世界的认知。
令人欣慰的是,最近发布的 Stable Diffusion 2.0 宣布将训练数据中的成人内容过滤掉了,对于 SD 这样有世界影响力的开源项目来说是一大进步。
4、互联网中更常见的内容 AI 会容易理解和生成
中国插画家 wlop 在互联网(尤其在国外)非常有名,网上有大量 wlop 的图片。所以很多 prompt 会加上 "by wlop",以期得到这种唯美的画风。而搜索 “罗小黑”,则没有相关图片,可以预见的,我们希望生成这只小黑猫就不能直接描述 “一只奔跑的罗小黑”,否则 AI 不会按我们期望地去生成一只小黑猫。这就是为什么 AI 理解天使、魔鬼之类的西方概念,但女娲、生肖、京剧等很多中国的概念不容易被生成原因。
你已经是个成熟的 AI 了,该学会自己画画了
回到最开始的问题,ai绘画的作品是原创吗?可以参考百度百科对 “原创” 的解释:
原创是独立完成的创作。 原创不属于歪曲、篡改他人创作或者抄袭、剽窃他人创作而产生的作品,亦不属于改编、翻译、注释、整理他人已有创作而产生的作品。
从技术角度,我们在 一文讲透ai作画原理技术、 ai绘画是怎么画的?ai绘画算法揭秘 中已经介绍了 ai绘画的原理:AI 是在图像空间找到一张图的坐标,再将坐标还原成图像。只要参数有些许扰动,生成的图像都是独一无二的。至于网上常说的 AI 绘画 “抄袭” 了某艺术家,可能是 AI 生成的图在图像空间某个维度上与现有作品坐标接近。
从人文角度,古人云 “读书破万卷,下笔如有神”,学习和借鉴是好原创的前提。人类艺术家尚且从临摹练习开始,AI 去学习大量人类艺术作品无可厚非。现有的原创基本都是 “站在巨人的肩膀上”,人类艺术家可以坦言我受到某作品的启发,但 AI 目前没法儿描述其生成的作品在一些维度上与某作品接近,只能任人批评,这是 AI 比较吃亏的一点。
BOB 在独立创作的文章末尾会加上 “原创” 二字,有赖于我接受了十余年的人文教育,大字不识的文盲可能很难创作出一篇原创文章。
AI 是工具,ai绘画的作品是不是原创,关键看用工具的人有没有原创精神。我们可以让 AI 沦为 “抄袭” 的工具,也可以共同探索如何借助 AI 实现各行各业的想象力腾飞。
上图:画宇宙 AI 生成的 “长得像香蕉的鞋” / “长得像榴莲的鞋” / “长得像西瓜的鞋” / “长得像火龙果的鞋”
图片引用:
- 58 亿图片数据 ~ 看看 AI 学了啥?
- 你已经是个成熟的 AI 了,该学会自己画画了
【原创】
作者:倒立的BOB
更多精彩内容请访问 ~