给年轻人的有关AIGC的信息、思考和建议

频道:AIGC 日期: 浏览:
作者:潜龙资深游戏人
说明:由于文章较长信息量较大,因此有关名词的解释,以及一些关于AIGC的基础信息,就不在文章中详细阐述,确实不太了解的,可以自行通过网络获取相应的基础知识。
说明2:本文的目的如标题所述,主要是希望把一些与AIGC有关的相对准确的信息,以及具备一定参考价值的建议,给到当下的年轻人,避免年轻人被混乱的资料迷惑和被误导,无法正确地对AIGC进行认知和学习。
一、观点建议前置汇总
开门见山,将我个人对年轻人的相关建议总结,罗列如下,方便急性子的同学先行了解:
1、 要积极关注新事物新热点,别神化工具,也别看不起它。必须去了解、尝试和学习与AIGC有关的各种内容,并不是AIGC有多重要或多先进,而在于不能因为不关注,而与同龄人拉开差距,年轻人,绝对不能放弃对未来的持续了解和认知。
2、 要看本质,不要追噱头。AIGC本质上是一种新潮的数字化工具,不要跟随某些媒体,主动把相对科幻和玄幻的未来AI功能想象,嫁接到当前的AIGC应用上,来吓唬自己。
3、 学习过程中,要多探讨功能价值,少放飞无用想象。探讨AIGC时,不要陷入通过对未来不切实际的假想来决策自身当下行为的怪圈。更多时候,我们应当关注当下的这个新数字工具能做什么,能实现什么功能,能提升哪些具体事务的效率,以及会给我们的学习工作生活带来什么样的变化。
4、 数字内容要为实体服务,单纯的虚拟数字容易掉入务虚陷阱。AIGC的发展,会帮助我们更快地打通虚实之间的交互屏障,对于近未来我们更深化的日常数字化生活来说,基于虚实的交互必然会越来越普遍,而AIGC的功能特点和优势,正好可以解决诸多当下虚实交互的难点和问题,因此AIGC有可能会成为未来以虚实交互为主要表现的数字化生活的技术基础,这也是作为年轻人,更应当主动了解、接触、尝试和学习AIGC的主要原因。
5、 少看营销号,拒绝被忽悠。不要被各式各样的媒体自媒体灌输奇怪的AI理论,更不要被它们刻意营造的恐慌所误导,要清晰清楚地认识世界的运行逻辑,以及人类的思考逻辑,人类的分散决策机制与AI的二分理论,并不是一个维度上可以用于直观比较的东西,要避免自身的思维被AI的运行逻辑扁平化。
6、 主动关注数字工具的迭代发展,不要停留在旧认知上。在我们的生活越来越数字化的当下,我们不可避免地会用数字化的方式,以及数字化的逻辑来进行判断,这样做的主要原因,是通过这种方式和逻辑,能够更好地简化我们的思考,缩短我们的决策时间,提升决策效率,但这并不代表数字化的方式和逻辑,能够真正改变我们。
7、 适当的时候,需要从更高的视角去看问题。一定要跳出那些常见的认知误区,不要被段子,以及相对玄幻的假想描绘的“未来可能性”给误导了,科技的进步从来都不是一蹴而就的,AIGC也不是万能灵药,可以解决一切问题,要审慎且客观地去了解和分析,再得出符合自身需求的结论。
二、以Midjourney为代表的AIGC能做什么
AIGC近几年被广泛关注,肯定离不开以Midjourney为代表的图片生成工具在社交媒体上的广泛传播,以及ChatGPT的火爆出圈,本文也将以这两个具备较强代表性的应用来展开。
相信大家在各种社交媒体,特别是在微信群里,见到过被多次转发,多次水印和反复降低图片品质后,图片都包浆了的梗图。
对于通过关键词描述来生成相应图片的AIGC来说,图片生成的过程,其实就类似上述这个不断加噪的包浆梗图的逆向化过程,也就是在图片素材库的帮助下,对关键词描述下的内容,进行不断的降噪,最终批量生成符合关键词描述,且具备符合训练图库显著特点的内容。
这也是相应的AIGC需要构建庞大的训练素材库,以及需要较强GPU算力的主要原因;同时也是对AI调教以后,能够提升出图品质的关键原因;并且这也是对美术具备更强认知能力和鉴赏能力的AIGC使用者,能够通过关键词描述,获得更具价值的图片的重要原因。
因为对同一个工具的使用,不同专业契合度的使用者,必然会有不同的产出效率和产出品质。
了解了AIGC的工作原理以及工具特点以后,我们就会发现,以MJ为代表的图片生成AIGC,有着特别鲜明的工具性特点,并且是一个很新颖的、相对高效的、需要一定专业基础的工具。
对于这样的工具来说,工具本身的迭代发展和进化,以及工具是否具备普遍使用性,工具是否具备替代其他工具的价值,就会成为其关键点。
以MJ为例,从2022年3月推出Beta邀请,到2023年3月推出大革新的MJ-V5,其发展和迭代速度是非常可怕的,去年暑假期间,MJ的用户还在纠结于出图的脸部不够真实、肢体形态别扭、手指脚指各种BUG,但到了今年,骨骼的使用和手指优化,是让很多老用户有惊艳到的。
基于这样的迭代发展速度,我们可以大胆的预测,以MJ为代表“以文生图”类AIGC,应当会在一个较短的时间内(6-18个月),进入到普遍商业化阶段,被应用在诸多领域,其商业价值及未来发展是可期的。
因此,对于年轻人来说,没有必要去怀疑此类AIGC的价值和前景,更应当关注的,是MJ类的AIGC,可以被应用在哪些领域,可以用来降低哪些工作的门槛,可以给用户带来哪些领域的便利,甚至可以造就什么样的新岗位。
此处,我更希望大家去结合自身的专业方向和知识体系,来进行构想和探讨,进而得出属于自身的准确结论,因为每个人的知识结构都是有其局限性的,不同人看到的应用方向必然会有差异。
关键点在于,这些可能的发展方向和给相关产业所带来的影响、变革和冲击,能够让你接下来的学习和工作,产业什么样的变化,收获什么样的新思路。
我自身有相对比较长时间的游戏产业工作经验,因此在我看来,以MJ为代表的AIGC一旦进入普遍商业化阶段,那么就可以帮助美术实力不够强劲,人力成本相对局促的中小团队,以更为高效和专业的方式,确定产品的美术风格,甚至直接帮助团队获得所需的美术资源。
而对于体量较大的游戏公司来说,AIGC特色库的低成本构建,也可以有效提升项目早期的试错成本和试错周期,这些帮助都是直观可见的。
三、Chat GPT的关键点和发展方向
相较MJ已经处于商业化前期,Chat GPT显然还处于各种维度下的探索阶段,离普遍商业化还有一段距离。
在聊GPT之前,我们必须先厘清一个GPT使用的AI领域的关键性概念 “Human in the LOOP”(人在回路),简单来说,就是在对AI进行训练的过程中,通过在关键训练节点处,加入人工选择调优因素的方式,来加速AI的学习和成长。
举一个不是特别合适的例子,类似流浪地球2里,MOSS先后“吃掉”了图丫丫和图恒宇,从而通过“人在回路”的方式,快速获得了成长。只不过在现实当中,人在回路的方式,对于AI的训练成长所起到的作用,虽然也很直观,但却不如科幻电影来得迅速和鲜明。
需要特别说明的是,人在回路这个方向,之前并不被AI领域的科研人员广泛接受,或者换个说法,通过人在回路的方式来对AI进行训练,在AI的研究领域,是存在一定争议的。
当然,对于普通用户而言,以及对于年轻的关注者来说,这些并不需要太过去关注,我们还是把关注点放到GPT所处的阶段以及能解决的问题上来。
对比有明确落地场景的MJ来说,GPT最核心的问题,并不是它所出具的信息是否可信,也不是它所给出的内容能够给用户带来什么样的实质帮助,更不是它能不能通过某某考试,又或者它能不能“听懂”人类才能听懂的笑话,这些问题本质上都是细枝末节。
GPT当下面临的最核心问题,其实是GPT是基于计算机数字二元论逻辑规则下的线性产物,而人类思考问题则是网状神经规则下的多维逻辑。
嗯,这句话听不明白不重要,可以简单理解为,GPT的关键运行机制和所输出内容,并不符合人类社会生活的广泛需求。
举一个简单的例子,不少媒体自媒体都会告诉你,GPT可以用来写让导师都认可的优质论文,美国很多中学和高校要求学生不能使用GPT。
我们不去探讨这些信息的真实性、缝合性和复杂性,单纯只从需求本身来看,对于看论文的导师来说,收到一份论文,不管有没有使用GPT来生成,导师最容易出现的反馈是什么?
是“哇,写得真好,给你一个优!”
还是“看完了,写得不错,但在这些点上,你需要优化调整一下,改一改再重新提交过来。”
对于GPT来说,根据沟通获取用户需求,后台通过一整套机制来给出“用户最有可能想要的内容”,就是工作的一切了,这是符合数字二元论逻辑的,但对于人类用户而言,通过GPT得到自身想要的内容,必然只是开始。
因此GPT当下的问题是,虽然通过人在回路的方式,以及本身的人工智能应答方案,让用户获得了相对惊艳的交互体验,但却无法从人类的角度,帮用户解决真正的问题,更多时候GPT所扮演的角色,是让用户获得了一个更新更好的,不但能够帮助解决问题,甚至还能够帮助用户简化问题和明确问题的新型人机交互入口。
这有点类似搜索引擎从最早Yahoo!的树状细分方式,进化到Google的关键词搜索机制。这其实也是微软将GPT嵌入到Bing当中,同时也推出与Office办公组件结合服务的原因。
简单来说,用户通过GPT这个入口,可以更精准更省力地获取相应信息,以及梳理相应资源,而这一点在当下移动互联网海量信息,通过传统搜索引擎需要付出较高时间成本才能获得有效信息的环境下,是具备解决方案层面的领先优势的。
但这也是当前GPT还不具备普遍商业化价值的关键所在。
因为当我们思考GPT的商业落地方案时,就不象MJ那样有许多可以提升效率,甚至改变某些领域环境业态的畅想。
毕竟从根本上来说,GPT这个入口,还没有真正意义上被明确和固定下来,甚至这个入口的形态,以及这个交互入口的交互机制和交互优势,也没有被完全挖掘出来,未来或许有着更多的可能性,但至少眼下,以GPT-4为标准来看的话,还需要继续迭代发展,直到这个入口被明确下来,并承担更多的职能,满足用户更多的复杂诉求。
四、其它类型的AIGC有哪些价值
当然,除了MJ和GPT,还有不少其它类型的AIGC应用和工具,例如Notion AI、Tome、Fliki等AIGC工具。
这些AIGC工具往往会在某个细分领域,或某个具体的场景,提供更优的解决方案或功能体验,考虑到这块的实际探讨空间会相对明确,同时专业度也更细化一些,因此就不再做展开式的探讨,只是简单地把一些个人的看法和建议同步给大家。
简而言之,大多数此类的AIGC,往往会专注于“用更省时省力的方式解决某个具体的日常需求”,或“提供给用户新的具备颠覆性感受的特定场景下的使用感受”。
因此,以当下AIGC特别快速的成长和发展来看,在未来的6-18个月里,应当会有至少2-3款此类AIGC,进入到广泛用户关注的视野中,进而推高用户群体对AIGC的整体期望。
同时对于年轻人来说,如果有明确的关注方向,以及有更为清晰的自身定位,那么多某个特定领域来关注AIGC的整体发展,或许是一条提升自身能力和抢占优势发展机遇的捷径,值得关注和尝试。
此处我不负责任地随便举几个可能的例子。
例如通过关键性图文和模板,生成短视频和动画的AIGC;通过真实图片批量生成二次元图片和视频的AIGC;以及反过来,通过动漫图片和描述,生成具备真实度的真人图片和视频等等。
总的来说,这会是一个相对具备活力,且有诸多可能性的AIGC领域,值得年轻人投入更多的时间、精力和关注度。
-->
关键词:

评论