如今,没有人会怀疑,AI 的技术迭代速度已经快到让人类感到恐惧的程度。
ChatGPT、Stable Diffusion、DALL-E和Midjourney——这些AIGC(人工智能生成内容)产品的出色表现唤醒了世界对生成式AI的认知,扩宽了大众对AI技术的想象边界。而各大科技巨头的连番动作也表现出了紧迫感。过去一周,被称为AI产业大爆炸的一周。
北京时间3月21日夜,AI背后的算力引擎,英伟达一口气推出多款新品,大秀技术实力,为AI发展提供了成本更低、效率更高的解决方案。
几乎同一时间,谷歌也开放了对标ChatGPT的聊天机器人Bard内测、Adobe发布了生成式AI工具Firefly,计划加入自家全家桶。同时,微软的New Bing也宣布加入AI作画功能。
一夜之间,四家科技巨头接连公布AIGC最新进展,这场“AI之战”,已经进入白热化阶段。
“赢家”英伟达,狂推多款新品
“人工智能的 iPhone 时刻已经开启。”当地时间周二,在英伟达年度GTC(GPU Technology Conoference)开发者大会上,CEO黄仁勋在演讲中四次提及这个比喻。
黄仁勋认为,在技术浪潮下,每个人都是程序员,而生成式AI就是新的计算平台。就像曾经的PC、互联网、移动设备和云一样,生成AI将重塑几乎所有行业。
生成式AI热潮背后,长期押注AI的英伟达可以说是受益最多的赢家之一。
今年以来,英伟达股价涨幅超过80%,市值接近6500亿美元,一举超过特斯拉。英伟达也把AI当作一次再度腾飞的机遇。2023年初,各大科技公司财报季中,英伟达提及 AI 75次,超过谷歌、微软和Meta,公司的数据中心业务再次成为最大的收入来源。
尽管英伟达四季度营收同比下滑21%,但基于AI芯片的销售,该公司在当季的表现略好于市场预期。
对于研究大型语言模型的公司来说,算力是其中极为重要的一环,AI大模型的推理和训练高度依赖英伟达的GPU芯片。缺少芯片会致算力不足,计算能力不足就无法处理庞大的模型和数据量,模型就会存在“智力”差距。
此次,GTC大会上,英伟达一口气推出了四款新的芯片,都是针对当下最流行的生成式AI。
分别是,L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片,擅长AI视频、图像生成、ChatGPT等大型语言模型的推理加速、推荐系统和大型语言模型的AI数据库。
AI视频芯片L4,用于视频解码和转码、视频内容审核、视频通话等;推理芯片L40,主要用于Omniverse(英伟达的“工业元宇宙”)、图形渲染和生成式AI,包括文本到图像和文本到视频等。目前流行的AI生成图片平台Midjourney、Stable Diffusion、DALL-E等都可以通过L40创造更多可能性。
虽然同为针对图像的AI推理芯片,L4针对云端的视频场景,而L40则更通用,可以实现所有与图像相关的场景优化。
而针对如GPT等大模型,英伟达推出了针对大模型的芯片——H100 NVL。这是一种具有94GB内存和加速Transformer引擎的大语言模型(LLM)专用解决方案,配备了双GPU NVLINK的PCIE H100 GPU。
AI计算离不开大数据。英伟达也推出了存算一体超级芯片Grace-Hopper,用于海量数据的存储、查询与推理。
“Grace-Hopper 是处理大规模数据集的最佳选择。”黄仁勋称,“我们的客户希望建立训练数据大几个数量级的 AI 大模型,Grace-Hopper 是理想的引擎。”
实际上,计算成本已成为今天阻碍生成式 AI 发展的核心问题,OpenAI 为此烧掉了上百亿美元,微软也出于成本考虑,没向更大范围开放 Bing ,也限制用户每天的对话次数。
英伟达推出的更高效的算力方案,也算是直击行业痛点。
而针对芯片行业的算力需求,英伟达也宣布推出 cuLitho——一个计算光刻库。并与 ASML、台积电等巨头展开合作,从而大幅降低芯片设计过程中的算力消耗,节能减排。“加速计算是减少电力消耗、实现可持续性发展和碳中和的最佳方式。”黄仁勋说。
另一个涉及生成式 AI 的重点,就是 DGX Cloud,这是一项AI超级计算服务,企业按月租用DGX Cloud集群,确保能够快速轻松地扩展大型多节点AI训练。微软Azure预计将在下个季度开始使用DGX Cloud,并且该服务将很快扩展到谷歌云。
英伟达还分别针对AI大模型、视觉、药物研发三个场景推出了定制大模型代工的云服务,简化了企业自己开发生成式AI应用的成本。
这种合作关系将英伟达的生态系统带到了云服务商手中,同时扩大了英伟达的市场规模和覆盖面。
谷歌再推聊天机器人,Adobe也要更新“全家桶”
在黄仁勋徐徐秀实力之时,几大科技公司也“步履不停”。
首先是谷歌,开放了其对标 ChatGPT 的产品 Bard 的内测申请。
这并不是 Bard 的第一次面世。早在今年2月8日,谷歌就已经对外展示了这款聊天机器人。但那场展示会让谷歌当日股价大跌9%,一天就丢了1000亿美元的市值,Bard面向大众的测试也被迫推迟。
因为,Bard在第一个关于詹姆斯·韦伯太空望远镜的问题上就犯了错,也让谷歌连忙撤下相关演示的官方视频。足以见,谷歌在这场“不得不应”的AI之战中,还未做好充足的准备。随后,也传出谷歌要求内部人员加大测试力度的消息。
匆匆一个月后, Bard 再度推出内测申请。它暂时还不支持更多语言(包括中文),Google 会持续更新写代码、识别/生成图片以及多语言支持。此外,Bard目前不具备编码能力,因此不支持有关代码的响应。有拿到内测码的测试者表示,“对话效果相比ChatGPT还是差远了。”
另外,Adobe展示了自己的创意生成式 AI 模型集 Adobe Firefly,一种可以根据文本提示生成图像,并提供数百种样式供调整,另一种则是能生成各类文本效果,类似艺术字。Adobe 认为,AI 正在提供一种打开世界的新方式,设计师可以用最顺手的方式来实现创意,“帮助创意人而不是取代创意人”。
几个月前还在抵制AI绘画的设计师们,显然已经无法阻挡这股技术洪流了。
正如微软往office全家桶里塞进GPT-4,来提升办公室软件效率。Adobe也计划把AI工具Firefly塞进Adobe全家桶里,让设计师们更方便使用。目前,该系列工具已经集成在Adobe的企业级创意工具Adobe Express,而后续将全面接入旗下Photoshop、Illustrator以及Premiere。从演示成果看,Firefly虽然不如Midjourney效果惊艳,但实用性更强。
同一时间,微软为新 Bing 和 Edge 浏览器的预览版更新了三个新功能:Bing Image Creator、人工智能驱动的 Stories 以及 Knowledge Cards 2.0。其中,最引人注目的是可以画画的 Bing Image Creator,让 Edge 浏览器变成了第一个集成人工智能图像生成器的浏览器。
这个夜晚,英伟达、微软、Google、Adobe 等厂商里都推出了各自的 AI 服务,谁都不想,也难以停下技术探索的脚步。AIGC最“卷”的一夜过后,也只是一个开端。
作者 | 赵子坤
编辑 | 董雨晴
扫码关注
QQ联系
微信好友
关注微博