港湾观点︱罗马不是一天建成的

返回 <<港湾视界

东方港湾 2024-04-12

GPT4发布至今，已过去整整一年时间。这一年里大模型军备竞赛烽烟四起，在软件编程、药物研发、图片视频生成、搜索引擎、广告推荐系统、手机硬件、自动驾驶等等领域都铺开了应用，带动了基础算力芯片的需求大爆发，除了世界几大科技巨头加大了资本开支，传统企业和各主权国也纷纷加入了人工智能“生产车间”的建设队伍。在此背景下，本月纳指也创出了历史新高。但在许多投资人的脑海中，却始终萦绕着一个挥之不去的担忧：如果我们看不到AI应用的大范围普及，AI的投资热潮还可持续吗？

答案不言而喻，但在那之前，我们需要正视几个事实，这对于当下的AI投资是至关重要的。

第一，我们之所以很难看到“AI应用”，是因为目前的模型仅能完成“任务”级别工作，但这并不代表着无用。如果我们把一个“职位”分解成n项不同的“工作”，再把每一项“工作”分解成m种不同的“任务”，按照山姆奥特曼的说法，现在GPT4也只能完成这些任务中的10%。所以，我们没怎么看到成型的“app”，而是更多散落在各种应用里的零碎任务中。例如AI翻译功能在大语言模型下已近乎完美，但我们也只能在手机实时通话翻译功能，或网页浏览翻译插件中看到其身影，而没有一个独立应用或产品叫作“aI翻译器”，这不能说AI没有用，事实上我们都在为此而付费。值得期待的是，当下AI研发的一个主流方向之一，叫“Agent”（智能体），也就是把能完成不同任务的智能体联合起来，加上记忆、反思和规划能力，去打造一个可以完成某些“工作”级别的应用。按照斯坦福教授吴恩达的数据，在同等模型能力之下，组合的智能体所实现的功能效果，完全不亚于模型级别的提升。

第二，阻碍AI应用普及的很重要原因之一是“推理成本仍然高昂”，但其下降的速度极快。以GPT的最新应用Sora为例，本月有研究测算，在当前的推理性能下，H100芯片每小时只够生成5分钟的Sora视频。Tiktok和Youtube之上每天产生超过6000万分钟的视频，如果有20%通过Sora来生成，假设GPU利用率为50%，实际候选视频有2个，峰值需求需要2倍GPU来满足，那这将需要80万张H100的GPU来满足Sora的需求，折合投资成本约200亿美元，这对于GUC行业来讲是高不可攀的。但如果以英伟达本月最新发布的GB200芯片来运行，尤其是NVL72的机柜形式，按其介绍，在FP4精度之下，推理性能将提高30倍，这将大大地降低Sora的使用成本，带动类似技术的快速普及。

本月的英伟达GTC大会上，公司发布了最新的芯片架构 Blackwell，新架构的亮点就在于推理能力的巨大提升。英伟达所称的推理性能30倍提升，来自三个方面：第一是芯片的拼接，在过往芯片堆叠CoWoS技术的基础上，英伟达首次将两块晶圆裸片合二为一，实现了晶体管2.5倍的提升；第二是在芯片的计算单元Tensor核心里，新增了两个计算精度—— FP4和FP6，这使得推理的吞吐量直接提高到原本FP8的2倍，也大大降低了内存和带宽的占用；第三是NVLink连接技术更新到了第五代，链接带宽高达1.8TB/s，在将72块GPU连城一体时，高速的并行算法也极大地提高了推理的性能（相同时延下更高的吞吐量），导致芯片的推理性能提高了6倍。假设单个B100的价格为3.5万美元，比当前H100的2.5万美元高出40%，那么对于推理应用者来讲，每单位的开支所获得的推理性能将提高20倍，或者说推理的成本将下降95%。这在24年下半年将给AI应用的普及，带来极大的促进。更令人期待的是，英伟达称这种架构的升级，在AI的帮助下，从过去的2年一次升级，已经提高到了现在一年一升级。今年的GTC大会刚开完，市场已经在期待明年的X100所带给人们的震撼。

第三，大模型能力提升的“缩放定律”依旧有效，我们可以期待今年闭源模型GPT5，和开源模型Llama3，在模型能力上的大幅提升。同时，经过一年的军备竞赛，闭源模型Anthropic、谷歌和Mistral，不约而同地在本月推出了自己新版模型Claude3、Gemini1.5和Mistral Large，这三款模型的模型性能也逐渐接近了GPT4的水平。未来，模型性能可能在更强的逻辑推理能力、更多模态协同、具备反思与规划能力、具备记忆和个性化能力等多方面进行升级，使AI应用能够解决更大比例的“任务”，甚至协同规划地独立完成某项“工作”。与此同时，本月一位微软工程师在社交媒体上，也爆出了GPT-6从去年9月开始训练，并对当地电网造成严重冲击的信息，也让我们对后续模型能力的升级更有信心。

第四，AI应用不仅以某种产品形态产生收入而存在，还在提高企业效率，降低运营成本上起到非常不错的效果。Meta的广告推荐系统就是一个很好的例子。Meta的四大社交平台上，有许多不活跃的用户，由于缺乏点击数据很难贴上标签，推荐相应广告。通过在广告推荐系统中融入大语言模型，Meta发现能很好地解决这部分不活跃用户的广告推荐“冷启动”问题，这不仅帮助公司弥补了苹果隐私政策变化导致的目标数据丢失，还推动了广告业务的增长和收入的提升。在广告文案生成方面，Meta的AI工具（Advantage+/GenAI）可以帮助广告主创建图像和背景等广告素材，并根据不同受众的偏好自动进行调整。Meta有1000多万的活跃广告用户，且大部分是没有广告制作经验的中小商家，据Meta的调查显示，有50%的广告客户认为工具每周为他们节省五个小时的广告制作时间，大幅地提升了效率。但如果对Meta研究不够深入，可能就对这种AI应用成果不甚了了。Meta计划在2024年购买至少35万张H100的GPU，一方面为其大模型训练添砖加瓦，另一方面，也是因其AI应用对广告的提效降本，起到了实实在在的作用。

第五，我们正在迎来两大杀手级AI应用的到来——辅助驾驶软件与手机虚拟助手。本月特斯拉正式宣布旗下辅助驾驶软件FSD V12版本全面在北美进行销售推广，所有新车试驾和老车主售后服务过程，都要求销售代表对FSD进行试驾演示，且所有硬件上符合条件的新老车主，都将获得一个月的免费试用。从最近一个月的试驾视频和反馈来看，FSD V12效果相当出色，马斯克称“几乎没人意识到辅助驾驶软件运行得有多好”。这是大模型从23年进入人们视野以来，最大规模的杀手级应用。此外，本月苹果传出正在探求与谷歌大模型Gemini的合作，为其六月份WWDC开发者大会上即将发布的AI虚拟助手提供模型支持。苹果在大模型训练上欠下了许多功课，但若不尽快推出Siri的升级版，其手机市场份额可能会受到动摇。我们预计手机版本的虚拟助手，将会是今年的另一项杀手级应用，会进一步带动苹果和安卓生态下的软件AI原生化。这两项AI应用，虽然距离全面普及可能还需要数年时间，但这中间已不存在明显的障碍，更多是产品持续打磨和接受度渐进提升的问题。

如果AI应用得不到广泛推广，最终这场AI革命必将暗淡收场；但据我们观察，无论从模型能力的升级，推理成本的下降，组合智能体的推出，企业提效降本的成果，还是杀手级应用的推出，AI应用的普及已经看到了苗头，具备了成型的必要条件。

AI作为一项“通用目的技术”，会彻底改变整个社会、经济和生活，但罗马不是一天建成的，我们见到了如火如荼“施工场景”，听闻到了全球各地和各行各业的人们，纷纷向这里靠拢，感受到了各个领域的领军人物对于这项技术所展示的信心，即便当下眼前还是碎石瓦堆，只要条件俱足，明日的宫殿楼宇，也只是一个时间问题。

风险提示及免责声明：市场有风险，投资需谨慎。在任何情况下，文章中的资讯仅供读者参考之用，并不构成对读者的投资建议。读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的，东方港湾不负任何责任。