画宇宙  >  最新文章  >  AI 绘画每日一帖 - 画宇宙  >  一文讲透ai作画原理技术 - AI绘画每日一帖

一文讲透ai作画原理技术 - AI绘画每日一帖

发布时间:2023-01-09 19:42浏览量:38040

近期热门的 AI 作画技术是通过文本描述生成绘画,但有人批评其是“抄袭”或“缝合怪”。实际上,AI 生成图片的原理是通过潜在空间(latent space)的操作来实现的。潜在空间是一个多维向量空间,可以表示一个图片的所有可能性。通过输入文本描述,AI 会在潜在空间内找到与文本描述相对应的向量,并将其转化为图片。

在上一篇文章 ai绘画是什么意思?什么是ai绘画? 中,我们讲到最近火热的 AI 作画技术是是通过文本描述生成绘画,今天我们就讲一下这背后的ai绘画技术和ai画画原理。


“大象上飞”~ 当 AI 开始想象

早在 1980s,人工智能的先行者们就在尝试解决 AI 识别物体的问题,最终在 2015 年 AI 的识别能力超越了人类水平。

画宇宙 - 人工智能 AI 绘画网站

能识别图片中的物体后,很快 AI 成功地将这些标签组合成一句话,这就是图像字幕技术(image captioning):通过图像生成对应的一句话描述。

画宇宙 - 人工智能 AI 绘画网站


这个过程能不能反过来?换言之,能不能通过图片生成描述图片的一句话呢?

画宇宙 - 人工智能 AI 绘画网站

相比从图片生成字幕,这是相当大的挑战,研究者希望 AI 能生成人们前所未见的图片。2016 年,这一设想成为了现实,就是这些 32 * 32 像素的图片。

画宇宙 - 人工智能 AI 绘画网站


这为我们展示了一些未来的可能性,而现在,未来已来!

画宇宙 - 人工智能 AI 绘画网站

AI = 缝合怪?

提到 AI 作画,很多批评者会提到 “缝合怪” “抄袭”。我们可能会假设,当我们输入 “一只骑摩托车的大熊猫”

画宇宙 - 人工智能 AI 绘画网站


AI 会在数据库里检索 “摩托车”、“大熊猫” 的图片,然后把他们拼在一起

画宇宙 - 人工智能 AI 绘画网站


但实际上并非如此,要了解 AI 怎么生成图片,需要先理解 latent space——潜在空间。大家都有自己的身份证号码,前 6 位代表地区、中间 8 位代表生日、后 4 位代表个人其他信息。放到空间上如图所示,这个空间就是「人类潜在空间」。

画宇宙 - 人工智能 AI 绘画网站


这个空间上相近的人,可能就是生日、地区接近的人。人可以对应为这个空间的一个点,这个空间的一个点也对应一个人。如果在空间中我的附近找一个点,对应的人可能跟我非常相似,没准就是我失散多年的兄弟 hh


AI 就是通过学习找到了一个「图片潜在空间」,每张图片都可以对应到其中一个点,相近的两个点可能就是内容、风格相似的图片。

画宇宙 - 人工智能 AI 绘画网站


所以这个空间中有一个区域是 “大熊猫区”,一个区域是 “摩托车区”。提示语 “一只骑摩托车的大熊猫” 会帮助 AI 找到「图片潜在空间」中某个可能位于 “大熊猫区”、“摩托车区” 交汇处的点。AI 再把这个点通过某种方式「生成」一张图片,这种方式就是大名鼎鼎的 “Diffusion”。

画宇宙 - 人工智能 AI 绘画网站


至于 AI 是怎么通过 prompt(提示语)找到「图片潜在空间」中对应的点,再把这个点生成一张图片,敬请关注 ai绘画是怎么画的?ai绘画算法揭秘



图片引用:


【原创】

作者:倒立的BOB


更多精彩内容请访问 ~

画宇宙 - 人工智能 AI 作画网站

网友评论
文明上网理性发言
登录
最新推荐 ->
AI 绘画每日一帖 - 画宇宙
AI 绘画艺术风格描述词合集汇总
AI 绘画艺术家描述词合集汇总
AI 绘画细节描述词合集汇总
AI 绘画动漫二次元描述词合集汇总
AI 绘画关键词 / 描述词 / 提示词...