“如果画一幅小桥流水人家的江南美景图,需要一个月,还是一天,还是一秒?”11月24日,2022世界智能制造大会“人工智能赋能智能制造论坛”现场,粤港澳大湾区数字经济研究院讲席科学家张家兴正在带领大家体验AIGC生成图画。只需手机端进入小程序,输入文字“孤帆远影碧空尽,惟见长江天际流”,再选择绘画风格,点击“绘画”就可一键生成图画,过程仅不到十秒。近日,人工智能绘画火爆全网,AIGC(人工智能生成内容)成为元宇宙发展新赛道。
AIGC:“缝合怪”还是“艺术大师”?
普通人也可以“画”出高难度艺术绘画?作品主体“人”“动物”“外星人”可以随意变幻?AIGC已经能模仿梵高风格画作?AIGC到底是何方“神圣”?
“简单来说,AIGC就是利用人工智能技术来生成内容,最新的模型可以处理文字、语音、代码、图像等格式的内容。”张家兴介绍,AIGC是一种全新的数字生成内容方式,生成的作品可达专业级别。
今年8月,一幅名为《太空歌剧院》的AIGC绘画作品在美国科罗拉多州举办的新兴数字艺术家竞赛中获得“数字艺术/数字修饰照片”类别一等奖。画面中,人物身着中世纪欧洲宫廷服饰,而宫殿之外的穹顶景象又似乎面向未来。据悉,画作创作者将AI自动生成的约100幅图像进行微调,经过约900次迭代,再经过约80小时的PS修饰,最终完成了这幅画作。
AIGC的生成逻辑是什么?以AI绘画为例,今年Diffusion 扩散模型彻底改变了以往对抗网络 GAN (Generative adversarial networks)的算法模型的缺陷。对抗网络GAN的技术逻辑为让AI内部的“生成模型”与“判断模型”进行“对抗”,生成模型产生假图片,判断模型进行判断是否为真实图片。在不断迭代训练中,当“判断模型”成功被“生成模型”生产的假图片欺骗时,便视为成功。
而Diffusion扩散模型,则利用高斯噪音的添加与还原,从图像中去除噪声分布,让机器学会“绘画”。“类似于给照片去除噪点,让机器理解‘有意义的’图像的产生过程。”某AI绘画平台技术人员解释。甚至,有人认为2022年可以被称为“AIGC元年”。
在内容生产领域,一次新的智能制造变革正在发生。“随着扩散模型等技术发展,通过 AI 进行内容生成正在走向技术成熟。图像、文本、3D、视频等传统需要人力来生产的数字内容,现在可以通过机器来自动化生产。底层模型在不断进步,也在推动产业的振兴。”张家兴说。
AIGC产业化:中国力量崭露头角
AIGC产业化的前奏,是大量UGC(用户生成内容)用户的涌入。近日,AI绘画迅速刷屏各大网络社交平台,亲民化的门槛让大众感受了一把科技圆梦“绘画大师”的力量。
记者在某AI绘图平台进行了体验,随机选择一张猫咪图片,再输入关键词“小女孩”,再设置个性化的“引导力度”“智能拓展”等参数,不到十秒,就自动“画”出了小女孩形象的图片。而在某网络社交平台上,众多脑洞大开、创意感十足的图片吸引了众多网友评论留言。
据悉,目前多数国内上线的AI绘画平台还处于试水期,会给予用户一定的免费使用次数,次数用完后则需充值服务。而在某知名购物平台,AI绘画已经作为一种付费服务出售,价格根据绘画难度从几元到近百元不等。
而降低AIGC的成本,也一直是产业化道路上不可避开的问题。个人用户不需要学习模型工作原理,只需在了解参数配置意义下进行个性化设置,便可输出内容。“其实AIGC的生产过程逐渐变为一种可重复性劳动,国际某知名平台每张AIGC绘画成本仅为0.5元。”一位插画师透露。
“目前AIGC整个产业结构里最重要的两件事,一是底层的预训练模型升级,二是自动化训练。”张家兴解释,要为每个AIGC产品提供个性化模型,必须基于自动的训练。近日,IDEA研究院认知计算与自然语言研究中心开源了首个中文版本Stable Diffusion AIGC模型——太乙,独创了拥有具备中国文化内核的AIGC模型,助力中国AIGC文化产业数字化转型。
“从文字生成图像,所有的内容生成都和文化相关的,任何一个文化都值得有自己的模型。”张家兴认为,AIGC模型的国产化替代对于产业化进程尤为重要。国内目前大部分团队是基于翻译API + 英文Stable Diffusion 模型进行开发,但由于中西方文化差异,这种模型在遇到中国传统文化叙事表达时,很难产出正确匹配的图片内容。
而在“太乙 Stable Diffusion”模型中,对中国传统文化内涵进行了模型升级,AI绘画也能输出“中国风”。例如,输入“君不见黄河之水天上来”这句古诗,便可生成一幅气势磅礴的黄河画卷。
据悉,AIGC产业化应用场景也在不断丰富中,可以进行音视频、游戏开发、代码生成等工作。以游戏开发为例,AIGC可用于游戏场景搭建和故事线开发,玩家也可以在平台创建自我虚拟玩家形象在游戏世界开辟“我的世界”。
“我们迎来了AIGC蓬勃发展机会,新领域、新产业,都将在未来一步步开拓。”张家兴说。
“迷局”待解?艺术永不消亡!
随着AIGC的兴起,也出现了新的待解“迷局”。
不可否认,目前AIGC的内容输出还存在“技术失真”的问题,比如部分网友吐槽AI绘画“把手画的得像叮当猫的圆手”“把美女的头发识别成大叔的络腮胡”“把戴帽子的人画成一个圆顶建筑”……“AIGC‘图——图’的生产对原图的细节把握还不够灵敏,所以会出现识别并转化失灵的现象。”插画师晏智说。
目前,国内外部分开源的AIGC项目自我监管效能较弱。“一些插画师的原创作品被纳入AIGC数据库成为训练数据,导致我们的创作风格被机器‘抄袭’。”一位插画师坦言,自己花了很久形成的绘画风格被机器轻易模仿,这样属实令人难以接受。并且,当需要用庞大的原图数据库“喂养”AIGC模型时,使用版权作品可能会涉及侵权风险。
“我们正在目睹艺术的消亡。”这是一位国外网友对《太空歌剧院》作品的评价。这幅作品的获奖在互联网上激起了众多国外网民的声讨。部分网友认为作者这一行为完全属于作弊,并要求其公开道歉。而该竞赛的评委则表示,评奖时的确不知道这是一幅AI绘画作品,但同时也表示并不会改变评审结果,原因是认为这幅作品符合该竞赛的评判标准——“有故事感,也有灵魂”。
此外,AIGC的兴起是否会替代人类劳动甚至导致部分人员失业?插画师糯米(化名)认为,AIGC确实给插画等行业工作者带来了一定的危机感,“但同时会给我们提供一些创作灵感,也在鞭策我们不断提升自我专业能力水平。当然,版权是底线,还是希望能明晰法律维权准则。”
不可否认,AIGC确实给音视频制作、插画、游戏开发等领域刮来了一阵寒风,但并不意味着行业凛冬已至。
“其实AIGC给很多非专业人士提供了一个创意发挥的空间,比如AI绘画可以让非专业人士将想法用关键词的形式交给模型处理,让创造力变成现实。”AI绘画博主有希说。
算法大脑的生成物是否可以被当作“艺术品”,有业内人士分析,AIGC可以代替人类完成机械性重复劳动,但更高层次的艺术“灵魂”,目前机器并不能代人类完成。
当然,用技术中性论的视角看,技术的进步带来的人体身体机能的延伸,是为了更好地驾驭技术应用。“与其担心被AI淘汰,我更想成为掌控技术的‘魔术手’,借技术的力量挖掘深层次的艺术灵魂。”糯米说。
新华日报·交汇点记者 程晓琳 张宣 蔡姝雯
扫码关注
QQ联系
微信好友
关注微博