4月,OpenAI公司在发布文字生成图像工具DALL-E 2时发出了一个不同寻常的警告。OpenAI发布的说明中提到:"该模型可能会提高执行一些任务的效率,如照片编辑或制作图片库,而这可能会取代设计师、摄影师、模特、编辑和艺术家的工作。"
真的会取代吗?
到目前为止,这还没有成为现实。创作装置和雕塑艺术家Benjamin Von Wong说,事实上,DALL-E的出现提高了他的生产力:“DALL-E对于像我这样不会画画的人来说是一个很好的工具,” Von Wong说,他用这个工具来探索艺术创作的想法。“我不需要画出我脑海中的概念,而是可以通过不同的文本提示简单地生成它们”。
文字图像生成工具,是设计师的天使还是魔鬼?
DALL-E 2 是众多用于图像生成的新 AI 工具之一。除了生成图像,DALL-E 2 还能够任意添加或删除图像中的元素,并且同时对该元素的阴影、反射和纹理进行处理。
设计师Aza Raskin使用开源软件为音乐家Zia Cora生成了一个音乐视频,并在4月的一次TED圆桌会议上展示。这个项目使他相信:图像生成的AI工具将导致创造力的爆发,并永久地改变人类的视觉环境,使原来难以想象和抽象化的东西变得容易创造。
视频来源:
https://twitter.com/aza/status/1491489350013505539?cxt=HHwWhsCq3avq6rIpAAAA
关于AI是否会取代人类创造性工作的讨论,似乎过于简单,且为时尚早。这样一种变革性的技术最终将如何影响插画师、摄影师和其他创作者,还有很大的技术进步空间。发布YouTubeAI工具使用教程的数字艺术家Noah Bradley说:“在艺术界,有太多的厄运和忧郁,有些人过于轻易地认为机器可以取代人类的创造性工作。”
Bradley认为,像DALL-E模型的影响将类似于智能手机对摄影的影响,使视觉创意更容易获得,而不会取代专业人士。他说,创造优质、可用的图像仍然需要在图像第一次生成后进行大量的细化调整。艺术创造有很多复杂性,机器还没有准备好。
过去两周一直在使用DALL-E的日本摄影师、作家和英语教师David R Munson却表示:“这就像与一个外星生物交谈。它试图理解一个文本提示,并向我们传达它所看到的东西。”
Munson把DALL-E对他的文本提示做出的反应比作儿童一般缺乏逻辑思维能力的表达。他要求程序创造一个 "拿着圣经的烤肉",他以为它会生成类似一锅有眼睛的炖肉,但他得到的东西完全不同。”它做出了这些奇怪的、块状的肉人”。Munson还用DALL-E重现了他童年时的一段生动记忆,即1986年观看挑战者号航天飞机失事的电视新闻,这个画面又意外地贴近他的真实回忆。
文字图像生成界的百家争鸣
谷歌最近宣布了两个AI文字图像生成工具,5月的Imagen和6月的Parti。一些开源项目也创造了图像生成器,如Craiyon——一个脑洞十分清奇的低配版AI图像生成器,在人们开始使用它在社交媒体上发布图像后,也开始走红。
新的公司已经开始涌现,AI艺术工具也逐渐走向商业化。一个名为Wombo的网站和应用程序(https://app.wombo.art/)可以根据文本提示或现有图像生成各种风格的图像,而消费者需要为打印生成结果或将其创建成的NFT付费。
而近期,在这项技术上走的最快的、玩的最666的,莫过于TikTok 了。在特效菜单界面里,新增加了“AI 绿幕” (AI Greenscreen) 的新选项。在这里,输入文字,就可以迅速生成一张竖版画作,用作短视频的背景。具体信息可点击这里,查看公众号“硅星人”的文章。
Midjourney是一个独立的研究实验室,至今已经吸引了全球数百万人前来参与测试。Midjourney搭载在Discord频道上,在对话框中输入 /imagine 的指令后,输入文本描述,机器人会在后台开始生成渲染图片,并在对话框中实时生成预览图,平均每张图片的生成时间在 1 分钟左右。其图像效果十分精细,完成度非常高。
Midjourney公司的创始人David Holz表示,他不认为他的AI文字图像生成工具会与艺术家形成竞争:“我们专注于探索想象力的本质。想象力被用来做很多事情,有时是艺术,但更多时候是简单的思考和游戏。我们不会把我们做的东西称为AI艺术,因为AI不会自己做任何东西,它没有意志。”Midjourney运行着Discord,测试者可以向其提交文本提示,供公司的算法使用。Holz说:“许多测试者都是艺术家,他们对使用该技术作为其工作流程的一部分感到乐观”。
但是,文本图像生成并不是万能的......
DALL-E和其他许多AI艺术工具都建立在机器学习领域的最新进展上,但这些图像生成系统缺乏对世界的真正理解,可能会产生缺陷或无意义的图像。
而且,由于它们复制的是来自网络的图像,它们可以反映出社会的偏见,例如,总是把医生渲染成男性,把空乘人员渲染成女性。这种程序还有可能被用来生成假照片,用于传播错误信息。
OpenAI已经承认了这些风险,并表示已经采取了措施,防止DALL-E被用来创造令人反感或误导大众的图像。这些措施包括防止系统响应生成某些不良词语的图像,并限制生成名人的容貌等。
AI图像生成器的错误、故障以及搞怪滑稽的风格,可以让人感觉到其本身就是一种艺术辅助工具。上个月,上文提到的Craiyon生成器流行起来之后,其迷乱、荒诞的画风吸引大批网友涌入,创作出了不少梗图,从而使得Craiyon彻底出圈,成为了新一代的“梗图之王”。
Craiyon生成器的由来也非常精彩。
这个项目原本是Craiyon生成器的创造者Boris Dayma为参加Hugging Face 挑战赛而设计的。当时,OpenAI的DALL·E 2只给数量极其有限的技术人员开放了使用权限。而Dayma自己做出来了一个小规模的免费版本,初衷就是希望更多人能免费在文本图像生成的海洋里尽情玩耍。这个项目,他自己称为 DALL·E mini。没想到效果太好,被粉丝、各路媒体们迅速冠以“梗图之王”的称号。
但其实, DALL·E mini 除了名字之外,跟 OpenAI 的 DALL·E 是没有关联的。由于它近半年以来实在太火,为了避免误会,Dayma 只好把自己的项目名称从DALL·E mini 改成了 Craiyon(https://www.craiyon.com/)。
一位艺术评论家将Craiyon背后的AI局限性描述为“线上怪诞生成器”。Craiyon的开发者透露,目前Craiyon后台正在面临巨大的算力和流量压力,每天要处理大约500万次生成指令。
上述图片来源:https://twitter.com/weirddalle
Tom White是一位驻新西兰的艺术家,他说:“也许AI图像生成器带来的最大变化是极大地扩大了能够生成和实验艺术插图的人数。乐观地说,这是一场交流上的革命。” White也表示,即使那些不懂艺术的人也可以使用这种工具来生成有创意的图像,人们已经在用Craiyon创作各种梗图,而这将可能改变人们彼此之间的交流方式和社交关系。
White的艺术作品包括精心制作的抽象图像,以骗过普通的图像识别程序,他说他喜欢测试DALL-E 2,试图揭示图像在训练数据中的方方面面,以及系统中防止生成攻击性图像的限制。随着时间的推移,他开始在系统的失误中看到一种 “个性”。
White认为像DALL-E 2这样的工具会变得更加强大,更加有趣,并且可以以不同的方式与它们互动。
目前,完善DALL-E生成的图像的唯一方法是重写文本提示或将剪裁出来的图像作为一组新的提示。White认为,用不了多久,使用创造性AI工具的人就能对图像进行具体调整。
“DALL-E不是道路的终点。”White表示。
而人工智能,也不是艺术创作的终点。AI与各行各业的结合,是辅助和提升,而非简单意义上的取代。
本文来自:
https://www.wired.com/story/when-ai-makes-art/
作者:Tom Simonite
整理:Hilaire、Hansey
Illustration by Violetta Barsukfrom icons8
-The End-