大厂涌入,马斯克盛赞,科技圈都在说的AIGC究竟是什么

频道:AIGC 日期: 浏览:

文 | 山核桃

如果要问科技圈最近最火的话题是什么?AIGC无疑是创业者与投资人们最关注的话题。今年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,一位毫无绘画基础桌游公司老板提交了一幅用Midjourney完成的AI生成绘画作品《太空歌剧院》,随即引发了一场人工智能与艺术家之间的大论战。

引发“唇枪舌剑”的不仅是AI绘画,随着应用场景的扩容,人们对AIGC技术的商业化潜力逐步从偏C端的娱乐游戏,拓宽至工业、金融、医疗、教育等2B领域。那些AIGC的拥趸者试图将其理解为打开元宇宙大门的“魔棒”,是继PGC和UGC之后,新一轮内容革命的生产力工具。

然而,在这根“魔棒”所点燃的浪潮下,从实验室里走出的AIGC可能并不如极客们想象中那么美好,不管是与国外底层技术能力的差距、产品形态的同质化、单一的商业化场景,还是所面临的版权与伦理问题,种种迹象都在表明,AIGC仍尚处萌芽期。

本文主要围绕AIGC解决以下三个问题:、

1. AIGC为何会兴起?

2. 抢滩AIGC的大厂与创业者,进行到哪一步了?

3. 为什么说AIGC是一场属于“冒险者”的游戏?

AIGC爆火的三要素:技术、需求与产业链

时间拨回2019年,在世界人工智能大会上,马云与马斯克曾针对“机器与人到底谁更聪明”这一问题展开一场精彩的辩论。作为新技术的狂热爱好者,马斯克理所当然地认为人工智能比最聪明的人还要聪明,而马云则认为“人类足够聪明,AI不是一种威胁”。

“双马”之间的battle,某种程度上可以代表当下人们对AIGC的两派观点:一类将AIGC视为生产力工具,是web3.0时代的基础设施;另一类,则对新技术抱着观望与怀疑,认为其与大多数元宇宙技术一样,不过又是一场极客们的狂欢。

尽管,目前人们对AIGC技术究竟是什么,依旧没有形成广泛的共识,但仅用其英文翻译(AI-Generated Content),即“利用人工智能技术来生产内容”,并不能准确理解AIGC。

参考学界以及业界的诸多观点,AIGC其实并不是一门单一的技术,也不是一类具像化的产品,其本质是利用AI赋能技术而形成的一种高自由度且低门槛的内容生产能力,而这种能力将服务于各类场景中的创作者与生产者。

事实上,AIGC并不是新鲜事物,人们所熟悉的DeepMind、会作诗的微软小冰以及近期横空出世的ChatGPT,都可被视为AIGC发展过程中的重要节点。

那么,一个关键问题产生了,既然不是新鲜事物,那为什么AIGC会在2022年突然受到人们的关注?核心原因其实在技术、需求与产业链的共同驱动。

首先,深度学习技术的快速突破,可商用的成熟技术起着“临门一脚”的关键作用。

在深度学习模型的迭代上,AIGC最早出现的深度学习模型为“对抗生成网络”GAN,尽管曾被称为“21世纪最强大的算法模型之一”,但也存在着生成图像分辨率较低、新图像创意不足等问题。而诞生于2021年的CLIP模型由于能够同时进行自然语言理解和计算机视觉分析,实现图像和文本匹配,也为后续AIGC应用的落地打下了基础。

来源:招商证券

到了2022年,Stable Diffusion扩散化模型的出现与正式开源,直接推动了AIGC技术的突破性发展。简单来说,Diffusion模型其实实现了两方面的突破,一是更成熟的深度学习模型能让AI可以快速、灵活地生成不同模态的数据内容。二是,这一训练好的模型大大降低了AIGC创业的门槛,更多的生产者与创作者可以借助这一可商用的开源工具,立足不同的应用场景做更多的事。

其次,是需求端对AIGC的追捧,AIGC恰好能弥补供给与需求端的这条“效率鸿沟”。

我们可以将创作者生态的发展分成三个阶段:专业生成内容时代(PGC)、用户生成内容时代(UGC)以及即将到来的AI生成内容时代(AIGC)。

在PGC时代,尽管专业化的内容能够为用户带来极佳的体验,但由于生产成本较高,产能往往跟不上需求。

而另一边,由此诞生的UGC模式能够大大降低生产成本,也能解决PGC的产能瓶颈,但海量内容参差不齐,尽管生产成本降低了,但用户对于优质内容的搜寻成本却在持续提升。

换句话说,一边是生产成本,另一边是搜寻成本,供给与需求的生产效率都有极大的提升空。而借助AI,一方面能够通过持续深度学习提升内容的专业性,另一方面也能辅助专业创作者,提升创作效率,供给与需求端的这条“效率鸿沟”也因此被缝合。

以ChatGPT为例,除了能更好地“效率鸿沟”外,我们能够确定的是,AIGC已具备很好的内容总结能力,去帮助人们一些具体问题。

根据“AIGC 探索站”主理人Szhans的总结汇总,ChatGPT在商业写作、人文创作以及日常生活等应用场景上,已具备足够的想象力,这些借助ChatGPT的视角而生成的内容某种程度上确实能够取代一部分的“初级内容生产者”。

比如,“写一篇关于AIGC的稿件提纲”——ChatGPT的回复已经包含了关于AIGC的大部分关键内容。

公众号“刘言飞语”的主理人刘飞也曾用ChatGPT写过一篇关于“互联网黑话”的领导演讲稿,“领导味儿”和“黑话感”都很足。

图片来源:公众号“刘言飞语”

当然,除了技术与需求端的变化,推动AIGC发展的关键因素还有产业链的初步成熟。

图片来源:量子位

据量子位AIGC图谱显示,从上游的数据供给、开源算法,中游的行业玩家以及下游的包括文字、图像、视频、音频、游戏等应用场景,关于AIGC的一条初步产业链已经悄然形成,产业生态的完善也为后期的发展奠定了基础,而在不同的应用场景下,已出现了一批代表性的玩家。

比如在文本生成场景,包括了澜舟科技、聆心智能等垂直公司,同时百度、腾讯等大厂也是该领域的重要玩家。

可以确定的是,技术、需求与产业链三大要素是AIGC快速发展的重要前置条件,但在国内一派火热的AIGC能否实现大规模的商业化落地,从目前来看,仍是一个颇为理想化的遥远故事。

效率大于价值,创意大于应用

AIGC当然是一片“富矿”。对乏善可陈的移动互联网创新而言,作为“元宇宙”世界的重要工具之一,据Gartner预计,到2025年,AIGC将占所有生成数据的10%,有潜力产生数万亿美元的经济价值。

在海外,作为较早布局AIGC的科技巨头,Meta、Google等已从文本生成等应用场景进入到视频领域,如Meta的Make-A-Video、谷歌的Imagen Video,AIGC丰富了科技巨头们的AI产品线。

一些新晋独角兽也成为了资本眼中的“香饽饽”,Stability AI、Jasper、OpenAI等企业的估值也水涨船高。据The Information报道,ChatGPT背后的开发商OpenAI目前的估值已接近200亿美元。

反观国内,尽管这一赛道也不乏明星初创公司与大厂加持,但行业发展看似火热,实际上却是“效率大于价值,创意大于应用”。

为什么这么说?主要有以下三点原因:

首先,在应用场景上,比起远大的“生产力工具”理想,目前国内AIGC的主要应用场景仍集中在图像生成、文本生成等领域,在尚未出现大规模落地的C端产品,产品的同质化趋势也大大加强。

以AI绘画为例,此类“文生图”的应用无论在图像生成模型上,还是玩法上,都已是红海。

如Midjourney,以轻量级小程序为主的意间AI、盗梦师等,由于使用门槛都不高,都曾在C端短暂地引发热议。

但正如行业从业者所提及的,需求端的火热以及Diffusion模型的开源,大大降低了行业的入局门槛。6pen创始人王登科曾提及:“一时间出现了上百家AI绘画的公司,也就导致了AI绘画工具的泛滥以及产品的严重同质化。”

其次,在内容模式上,当下的AIGC充其量只是辅助生产的效率工具,其创作模式实际上并没有跳出PGC与 UGC的创作框架,现阶段的AI绘画、AI文本都需要人为的参与与调试,实现与外部环境的交互。

以《太空歌剧院》这一引发巨大争议的AI绘画获奖作品为例,其并不完全是机器生成的,而是人与AI作画技术不断磨合过程的产物。ChatGPT也是如此,该创始团队也坦言:“AI生成的答案不总是准确或相关的。”这些通过模型生成的答案往往需要专业人士进行二次判定或润色。

最后,在盈利模式的探索上,国内AIGC的商业化仍在“摸着国外过河”。目前来看,无论是2B或2C,AIGC距离真正的商业化落地,还有较远的距离。

C端有着庞大的流量基础,但如何提升用户付费意愿,以更为个性化的定制服务与社区生态实现差异化,考验着大厂们与小型创业公司的能力。

而在B端,特别是一些提供大模型等基础设施服务类的科技巨头,固然也面临着广阔的蓝海,但生态如何搭建?后期运维能力如何提高?应用场景解决方案的深度如何?这些都是实实在在的问题。

AIGC是一场属于“冒险者”的游戏

而从更深层的角度来说,当下的AIGC更像是一场只属于“冒险者”的游戏。

首先,国内AIGC的生态并没有如国外一样形成较为明确的分工体系。大多数的大厂与创业公司都是专注垂直赛道的场景应用,渴望“大力出奇迹”的同时,大多数的AIGC业务其实尚属“边缘”。

对比国内与国外,欧美大厂和创业公司之间的生态更为成熟,一类专注做基础设施型,以技术为重,比如OpenAI提供技术模型GPT-3,而创业公司通过翻新模型,找到应用场景,不同生态方各司其职,在协同中,更易实现规模效应。

而在大洋彼岸外的中国,AIGC大多作为公司的部分业务或相对边缘化的功能,同时国内独立运行的初创公司数量明显少于国外。

从融资轮次来看,包括DeepMusic、倒映有声、聆心智能等初创企业大多集中在A到B轮,而盗梦师、意间AI等也并未凭借着社交媒体的热度由此收获新一轮的融资。

其次,在应用场景上,国内AIGC多局限在内容侧,这背后其实是当前中国的创业公司尚未找到能快速实现商业化落地的应用场景,还在摸索产品与场景之间的适配度。

再者,AIGC产业需要长期主义,聆心智能创始人、清华大学计算机科学与技术系长聘副教授黄民烈认为,如OpenAI这种技术见长的公司需要很多特别牛的工程技术人才,同时也非常烧钱,需要雄厚资本的支撑,“这样的资本投入在中国还是挺难复制的”。

这意味着,在未来很长一段时间内,AIGC都是一门“赔本赚吆喝”的生意,一些不具备资金实力与生态能力的初创型公司,很有可能面临着被大厂们收购或继续“小而美”的命运。

最后,则是伦理困境,如众多新兴技术一样,AIGC将不可避免地面临版权与数据确权问题,这当然是每一项新技术必然要经历的过程。黄民烈也提到,现在的大模型AI能力它很容易做到记住和模仿,但无法进行创造,因此就会不可避免地会面临一些版权,甚至是反人类的伦理问题。

某种程度上,在遥远的web3.0时代,与NFT、VR等热词一样,AIGC也是焦虑的人们寻找下一个“移动互联网”时代的新入口。但比起移动互联网时代那些已具备确定性的技术与场景应用,尚属萌芽阶段的AIGC更像是被一堆被吹高的泡沫,它必然经历与其他技术热词一样的降温过程,回到现实中找到具备商业价值的落地场景。

正如Midjourney创始人所言,尽管人工智能被视为新世界的“水源”,人们渴望它成为新一代的基础设施,但创业者们的任务是“是制造冲浪板,而不是制造水。”

在那些吹捧“奇点降至”的论调背后,AIGC距离真正的商业化繁荣,注定还有更难的路要走。

参考资料:

1、甲子光年:《AIGC爆火背后,钱都被谁赚走了?》

2、脑极体:《2023,AIGC能赚到钱吗?》

3、华创资本:《生产力的范式转移:一场AIGC带来的奇幻革命 | 创·享 CGC-XView》

4、华泰证券:《从孪生到融生,AIGC 成为长期方向》

-->
关键词:

评论