GPT4发布至今,已过去整整一年时间。这一年里大模型军备竞赛烽烟四起,在软件编程、药物研发、图片视频生成、搜索引擎、广告推荐系统、手机硬件、自动驾驶等等领域都铺开了应用,带动了基础算力芯片的需求大爆发,除了世界几大科技巨头加大了资本开支,传统企业和各主权国也纷纷加入了人工智能“生产车间”的建设队伍。在此背景下,本月纳指也创出了历史新高。但在许多投资人的脑海中,却始终萦绕着一个挥之不去的担忧:如果我们看不到AI应用的大范围普及,AI的投资热潮还可持续吗?
答案不言而喻,但在那之前,我们需要正视几个事实,这对于当下的AI投资是至关重要的。
第一,我们之所以很难看到“AI应用”,是因为目前的模型仅能完成“任务”级别工作,但这并不代表着无用。如果我们把一个“职位”分解成n项不同的“工作”,再把每一项“工作”分解成m种不同的“任务”,按照山姆奥特曼的说法,现在GPT4也只能完成这些任务中的10%。所以,我们没怎么看到成型的“app”,而是更多散落在各种应用里的零碎任务中。例如AI翻译功能在大语言模型下已近乎完美,但我们也只能在手机实时通话翻译功能,或网页浏览翻译插件中看到其身影,而没有一个独立应用或产品叫作“aI翻译器”,这不能说AI没有用,事实上我们都在为此而付费。值得期待的是,当下AI研发的一个主流方向之一,叫“Agent”(智能体),也就是把能完成不同任务的智能体联合起来,加上记忆、反思和规划能力,去打造一个可以完成某些“工作”级别的应用。按照斯坦福教授吴恩达的数据,在同等模型能力之下,组合的智能体所实现的功能效果,完全不亚于模型级别的提升。
第二,阻碍AI应用普及的很重要原因之一是“推理成本仍然高昂”,但其下降的速度极快。以GPT的最新应用Sora为例,本月有研究测算,在当前的推理性能下,H100芯片每小时只够生成5分钟的Sora视频。Tiktok和Youtube之上每天产生超过6000万分钟的视频,如果有20%通过Sora来生成,假设GPU利用率为50%,实际候选视频有2个,峰值需求需要2倍GPU来满足,那这将需要80万张H100的GPU来满足Sora的需求,折合投资成本约200亿美元,这对于GUC行业来讲是高不可攀的。但如果以英伟达本月最新发布的GB200芯片来运行,尤其是NVL72的机柜形式,按其介绍,在FP4精度之下,推理性能将提高30倍,这将大大地降低Sora的使用成本,带动类似技术的快速普及。
本月的英伟达GTC大会上,公司发布了最新的芯片架构 Blackwell,新架构的亮点就在于推理能力的巨大提升。英伟达所称的推理性能30倍提升,来自三个方面:第一是芯片的拼接,在过往芯片堆叠CoWoS技术的基础上,英伟达首次将两块晶圆裸片合二为一,实现了晶体管2.5倍的提升;第二是在芯片的计算单元Tensor核心里,新增了两个计算精度—— FP4和FP6,这使得推理的吞吐量直接提高到原本FP8的2倍,也大大降低了内存和带宽的占用;第三是NVLink连接技术更新到了第五代,链接带宽高达1.8TB/s,在将72块GPU连城一体时,高速的并行算法也极大地提高了推理的性能(相同时延下更高的吞吐量),导致芯片的推理性能提高了6倍。假设单个B100的价格为3.5万美元,比当前H100的2.5万美元高出40%,那么对于推理应用者来讲,每单位的开支所获得的推理性能将提高20倍,或者说推理的成本将下降95%。这在24年下半年将给AI应用的普及,带来极大的促进。更令人期待的是,英伟达称这种架构的升级,在AI的帮助下,从过去的2年一次升级,已经提高到了现在一年一升级。今年的GTC大会刚开完,市场已经在期待明年的X100所带给人们的震撼。
第三,大模型能力提升的“缩放定律”依旧有效,我们可以期待今年闭源模型GPT5,和开源模型Llama3,在模型能力上的大幅提升。同时,经过一年的军备竞赛,闭源模型Anthropic、谷歌和Mistral,不约而同地在本月推出了自己新版模型Claude3、Gemini1.5和Mistral Large,这三款模型的模型性能也逐渐接近了GPT4的水平。未来,模型性能可能在更强的逻辑推理能力、更多模态协同、具备反思与规划能力、具备记忆和个性化能力等多方面进行升级,使AI应用能够解决更大比例的“任务”,甚至协同规划地独立完成某项“工作”。与此同时,本月一位微软工程师在社交媒体上,也爆出了GPT-6从去年9月开始训练,并对当地电网造成严重冲击的信息,也让我们对后续模型能力的升级更有信心。
第四,AI应用不仅以某种产品形态产生收入而存在,还在提高企业效率,降低运营成本上起到非常不错的效果。Meta的广告推荐系统就是一个很好的例子。Meta的四大社交平台上,有许多不活跃的用户,由于缺乏点击数据很难贴上标签,推荐相应广告。通过在广告推荐系统中融入大语言模型,Meta发现能很好地解决这部分不活跃用户的广告推荐“冷启动”问题,这不仅帮助公司弥补了苹果隐私政策变化导致的目标数据丢失,还推动了广告业务的增长和收入的提升。在广告文案生成方面,Meta的AI工具(Advantage+/GenAI)可以帮助广告主创建图像和背景等广告素材,并根据不同受众的偏好自动进行调整。Meta有1000多万的活跃广告用户,且大部分是没有广告制作经验的中小商家,据Meta的调查显示,有50%的广告客户认为工具每周为他们节省五个小时的广告制作时间,大幅地提升了效率。但如果对Meta研究不够深入,可能就对这种AI应用成果不甚了了。Meta计划在2024年购买至少35万张H100的GPU,一方面为其大模型训练添砖加瓦,另一方面,也是因其AI应用对广告的提效降本,起到了实实在在的作用。
第五,我们正在迎来两大杀手级AI应用的到来——辅助驾驶软件与手机虚拟助手。本月特斯拉正式宣布旗下辅助驾驶软件FSD V12版本全面在北美进行销售推广,所有新车试驾和老车主售后服务过程,都要求销售代表对FSD进行试驾演示,且所有硬件上符合条件的新老车主,都将获得一个月的免费试用。从最近一个月的试驾视频和反馈来看,FSD V12效果相当出色,马斯克称“几乎没人意识到辅助驾驶软件运行得有多好”。这是大模型从23年进入人们视野以来,最大规模的杀手级应用。此外,本月苹果传出正在探求与谷歌大模型Gemini的合作,为其六月份WWDC开发者大会上即将发布的AI虚拟助手提供模型支持。苹果在大模型训练上欠下了许多功课,但若不尽快推出Siri的升级版,其手机市场份额可能会受到动摇。我们预计手机版本的虚拟助手,将会是今年的另一项杀手级应用,会进一步带动苹果和安卓生态下的软件AI原生化。这两项AI应用,虽然距离全面普及可能还需要数年时间,但这中间已不存在明显的障碍,更多是产品持续打磨和接受度渐进提升的问题。
如果AI应用得不到广泛推广,最终这场AI革命必将暗淡收场;但据我们观察,无论从模型能力的升级,推理成本的下降,组合智能体的推出,企业提效降本的成果,还是杀手级应用的推出,AI应用的普及已经看到了苗头,具备了成型的必要条件。
AI作为一项“通用目的技术”,会彻底改变整个社会、经济和生活,但罗马不是一天建成的,我们见到了如火如荼“施工场景”,听闻到了全球各地和各行各业的人们,纷纷向这里靠拢,感受到了各个领域的领军人物对于这项技术所展示的信心,即便当下眼前还是碎石瓦堆,只要条件俱足,明日的宫殿楼宇,也只是一个时间问题。
风险提示及免责声明:市场有风险,投资需谨慎。在任何情况下,文章中的资讯仅供读者参考之用,并不构成对读者的投资建议。读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的,东方港湾不负任何责任。