三月初的北京和硅谷,冬尽春来,乍暖还寒。我们调研走访了中美多家人工智能企业,AI时代加速进化的步伐与当前凛冽的市场寒冬,显得那么格格不入,就像王安石诗中描述的一般。
一、 墙角数枝梅
我们看到,AI模型的能力正在逐渐走向“大一统”,越来越像人脑一样的多模块协同系统。
人类为达成自我的意图或预期,需要用多种模态去感知世界的状态,统一融合到底层意识中形成内在的“世界镜像”,并使用直觉与逻辑去预演和验证,最后以行动输出的方式,去调整身边世界的状态,以达到自我的预期。这是人类与世界互动的模型,也是机器人的核心大脑——“世界模型”所需的完整架构。过去两年,我们看到LLM模型致力的方向是在其中的“认知模块”——直觉与逻辑能力的开发上。但今年以来,我们看到了“感知模块”和“行动模块”也在快速地发生进化。
感知模块上,本月OpenAI推出了GPT4o的原生图像功能,其展现的图像细节的精确控制能力,着实让人惊叹!这意味着在AI的感知模块中,继文本与语音后,文本与图像也完成了模态架构的统一。
过去AI的图像理解与生成过于模糊,主要原因是缺乏统一的向量空间和模型架构。AI在理解图片时,若图像和文本不在统一的语义空间中,需要将图片“投影”到文本向量空间中进行计算。由于文本表达能力有限,可能就导致图像中的许多细节信息(如空间结构、光影、材质等)无法被完整保留,造成了图片理解过程中信息的损失。而模型在生成图片时,也通常会将文本指令通过 CLIP 编码为语义向量,再用这些语义向量引导扩散模型的去噪过程,从而生成整张图像。但这种引导偏向整体图片的控制,因此模型在图像细节的把握上仍然较弱。细节决定成败,不可控的图片理解与生成,构不成生产力,因此过去不是主流AI应用关注的重点。而偏偏人类的视觉感知占了近90%的比例,视觉模态非常重要。
新版GTP4o原生图像,除了文本图像共用了一个底层的语义空间,图像生成的主模型也从扩散模型改为自回归模型Transformer架构。因此,AI在理解图片时,能够照顾到更多图片细节,减少翻译的损耗;在图片生成时,也更能把握图片细节之间的关联关系:类似于人类作画时,从构图、轮廓到填色、细节勾勒和调整,可以对图片的微小细节进行精准调整,可以照顾各部分的空间结构关系,甚至可以在图片上去训练模型的逻辑推理能力,例如对3D立体几何图的数学推演,或使用流程图或示意图去形象解释文本想表达的内容。我们发现更新后的GPT4o,在知识问答之中,会更加主动尝试使用图片对文本内容进行进一步的解释。
统一的图片文本架构,使得AI对世界的感知能力获得极大的提升,AI生图的应用也能进一步得到推广,为接下来的统一视频与文本架构打下基础。当所有模态都完成了统一框架后,跨模态的产业应用会层出不穷,AI的感知系统才算完备。
行动模块上,当前另一值得关注的重大变化,是Claude推出的MCP生态在快速得到传播和完善,本月Openai也宣布加入这一协议,AI可使用的工具与资源在变得越加丰富。人类与其他动物最主要的区别之一,是使用工具的能力;同样的,AI智能的高低区别,也是取决于可使用的工具种类和范围,我们可以称之为“工具智能”。这是AI的行动模块中最重要的部分。
过去两年,AI调用人类工具的方式和生态不断在演变。最开始,三方平台如Langchain,适配了一些AI可使用的工具,如天气查询工具或地图查询工具,允许大模型回答用户相关问题时,调用这些工具获取信息。但三方平台适配的工具太有限,后来OpenAI做了个GPT插件应用商店,让全世界开发者为ChatGPT去开发独家工具,但最终也默默无闻。去年末,Claude 团队发布了 MCP 协议,这是一个完全开源的“模型与工具连接标准协议”,允许任何 AI 模型通过 MCP 服务器,访问并调用统一封装的任何外部工具或资源。相比 GPT 插件商店,MCP 的开放性意味着工具提供商只需开发一次,即可面向所有支持 MCP 的模型共享使用。这极大激发了开发者的积极性,目前工具适配数量持续增长,短短数月已获超过一万多个工具应用的适配支持,生态在快速的完善中(MCP.SO网站上收录了大部分的工具与应用实例)。
有人将MCP协议,比喻成互联网时代的TCP/IP协议,后者是互联网存在和繁荣的根本。过去聊天机器人因为缺乏应用场景,AI的工具调用量较少,加上GPT插件应用商店开发环境封闭,OpenAI的插件商店基本以失败告终。但任务机器人——AI Agent对应用工具的依赖性会大大增强,使用频率和场景都大幅增加,加上MCP的开源兼容性,势必带来应用适配生态的繁荣。在足够多工具生态下,AI模型将会专门针对其中的某些工具,进行端到端的强化训练,节省许多提示词工程,增加模型使用工具的泛化能力。
GPT4o原生图像功能与MCP模型工具使用协议,这两个看似微不足道的进步,可能蕴含着产业巨大的变化。今年来,我们看到了Manus的脱颖而出,也看到了Cursor辅助编程的地位在不断提升,更看到了在Deepseek时刻之后,Gemini 2.5 pro、Claude 3.7、GPT4.5、o3等模型在加速问世。在即将到来的下一代的预训练模型——Claude 4和GPT5身上,我们看到了AI模型更清晰的“大一统”的方向:统一的多模态感知模块,统一的逻辑推理与直觉能力(就像职场新人的分步思考会逐渐升华为直觉),工具调用通过强化训练内化进模型(就像人类不断熟悉各种工具使用的练习),以及将以上三个模块进行统一端到端训练,不断减少AI应用中的提示词、工作流等脚手架支持,就像这两年FSD的发展那样。
二、 凌寒独自开
在AI不断加速发生质变的同时,投资市场却因宏观层面的不明朗前景而遭受了重挫——截至上周五,今年纳指从高点回撤了23%。这场寒流会有多冷?在回答这个问题之前,首先我们不妨回顾下纳指成立至今,在过去55年时间里,那些级别较大的股灾都发生了什么。再对比看看,我们离春天真正到来,还有多远。
2000年科网泡沫破裂,是一代投资人的噩梦,也是纳指历史上的最大回撤:始于2000年3月10日,一路下跌了31个月至2002年10月9日,最大回撤高达78%,直到2015年才重回新高,耗时15年之久!当年的背景可能众所周知:九零年代,在利率下行,通胀下行,失业率下降和GDP加速上涨的环境里,市场在互联网技术的疯狂推动下,从95-99年纳指分别上涨了40%、23%、22%、40%和85%,年均40%增速远高于过去历史10%的增长。直至2000年,由于过半数科技企业亏损,巅峰时候的纳指静态PE估值近200倍,IPO大量发行,有23%的新股首日股价翻倍。最后,纳指在美联储加息6次之后,才轰然倒塌!
1973年的石油危机,对大多数投资人可能更加陌生,那是纳指历史上第二大回撤:始于1973年1月11日,经过20个月的下跌,直至1974年的10月3日才止住,纳指最大回撤60%,一直过了4年到1978年才再创新高。早在1971年,由于美国的宽松的财政货币政策导致黄金持续流出,布雷顿森林体系瓦解,美元大幅贬值,便开始了美国的输入型通胀(CPI约6%),利率开始上行,股市开始摇摇欲坠。直到1973年10月的赎罪日战争开打,中东对西方国家实行石油禁运,石油价格短时间内上涨超过4倍,这令货币不断贬值的美国,通胀水平雪上加霜。原材料短缺,外贸大幅逆差,通胀导致利率大幅上升,经济衰退,失业率上升,纳指开始加速下跌。另一方面,当年标志性的漂亮50平均估值一度高达42倍,也成了当时大幅回撤的前提之一。
2007年的次贷危机,是纳指历史上第三大回撤:始于2007年10月31日,下跌超过16个月,至2009年3月9日最大回撤56%。3年半后的2011年4月,纳指才重回高点。我们这一代人都对次贷危机的经过记忆犹新:2000年股灾后,市场利率快速下调至1%,刺激了一波房地产投资热潮,美国房价连续5年跳涨了200%。在炒房狂潮中,次贷总量快速翻倍,缺乏监管的衍生品也泛滥成灾:本为房贷证券化产品的保险工具CDS,被玩成了次贷是否爆仓的对赌协议,08年高峰保额一度达47万亿(当时GDP的3.3倍)。而这段期间的市场帮凶——美国五大投行的财务杠杆率也急剧膨胀,2007财年末合计负债规模约4.1万亿美元,相当于美国GDP的30%。建立在房价不断上涨的超大市场杠杆,终于在联储加息和房价见顶的2006年开始崩塌。2007年3月,华尔街第5大投行——贝尔斯登因资不抵债濒临破产;4月,美国第二大次贷贷款机构——新世纪金融破产;9月美国第四大投行雷曼兄弟申请破产保护,最终引动了整个金融业的信用传导链条,AIG倒闭。而市场这才于10月末迎来了流动性危机的次贷股灾。
以上3次大型股灾,跌幅都在6成左右。除此之外,纳指历史上还有6次中型股灾,跌幅都在3成左右。
最近一次,是由2022年的俄乌战争,所点燃的纳指史上第四大回撤:从21年11月开始,历时11个月,最大下跌幅度34%,直至1年后的24年2月才重回新高。与193年类似,同样在战争爆发之前,新冠疫情就对全球供应链和产能开工率的打击,就使到21年美国通胀率水平从1%上升到7%。后知后觉的联储直到21年末才计划结束多年的低利率和QE环境,重新进入加息和缩表进程。在此预期之下,加上高估值本就脆弱,许多资金开始“先行撤退”。2022年2月,俄乌战争打响,这为全球大宗商品价格暴涨火上浇油,在通胀与利率上行的环境里,许多龙头企业利润也罕见的出现了负增长,市场进一步加速下跌。但随着通胀水平见顶,降息预期再起,加上GPT3.5上线,市场很快在23年的AI时代中收复了22年的失地。
1981年和1983年的两次“沃尔克时刻”,则上演了接连两次30%级别的回撤:1981年5月起,纳指下跌了14个月,回撤达到29%;虽然见底后只用了3个月就收服失地,但在半年后的1983年6月,纳指又开启了第二轮为期12个月,30%幅度的大回撤,直到1986年1月份才重回新高。1979年,伊朗革命导致了第二次石油危机,国际油价飙涨,美国CPI在1980年达到约13.5%的峰值。为抗击通胀,时任联储主席的保罗·沃尔克,采取了空前强硬的货币紧缩政策,联邦基金利率至1981年6月股灾发生时,已高达20%历史最高位。紧缩政策导致了美国经济连续数季度出现衰退,1982年的失业率更是高达10.8%,为二战后美国最高水平,被认为自大萧条以来最严重的下滑。沃尔克冲击造成经济和股市的短期剧痛,却成功解决了美国通胀,CPI同比增幅至1983年已经降为3%的水平。加上里根政府的扩张性财政政策,1983年起美国经济强劲复苏,股市也出现强劲反弹。但很快因担心物价重新抬头,1983年中,美联储又采取了“预防性紧缩措施”,这令刚从阴霾中走出的市场如获当头棒喝,加上纳指科技股短期内估值上涨过快,透支增长预期,在巨头德州仪器预告季度巨亏后,快速反弹中的科技股又一次出现了快速回撤。但是踩了双底的纳指,自83年就以后一路高歌,趁着互联网时代的东风,开启了一轮17年的大牛市。
1987年的黑色星期一,则是一次技术原因导致的回撤:纳指在1987年10月的一个月时间里,快速下跌了36%,直到2年后的1989年8月才重回新高。1980年代中后期,华尔街兴起了程序化交易策略,最流行的“组合保险”策略会在股市下跌时,自动卖出股指期货来对冲。这种意在保护下跌的流行策略,却成了10月集体抛售的起点。而当期货大幅低于现货时,买期货卖现货的套利行为,又进一步导致了现货崩盘,形成双杀螺旋效应。保证金追加,交易系统崩溃导致的投资者恐慌,期货现货交割时间不统一导致流动性错配,都加剧了这场历史有名的流动性连锁危机。自那以后,才诞生了我们所熟知的市场熔断机制、衍生品统一到期日(四巫日)、量化交易“减速带”等一系列市场交易机制,防止类似事件再度发生。
1990年的海湾战争,让刚从87股灾中缓过劲的纳指再遭重击:从1989年10月的1年内下跌超过32%,其中主要跌幅从1990年7月末开始。1990年8月2号,伊拉克入侵科威特,由美国领导的35个国家组成的联军,和伊拉克之间展开了一场局部战争。中东战事可能演变的各种不确定性——战争规模、持续时间、对全球贸易和油运的影响等——都在当时压制着股市估值。另一方面,油价从每桶17美元猛涨到近36美元,高油价衍生的通胀压力也限制了联储在市场大跌时的降息空间,利率在9%的高位下不来,令市场信心进一步受挫。与此同时,海湾战争也助燃了日本自1990年起20年的股灾,作为80年代美国的重要海外投资者,日本金融机构在自身受创后被迫收缩对美投资,也削减了美股潜在的外部资金流入。1989年纳斯达克整体估值水平在20倍以上徘徊,并不算离谱,随着海湾局势逐渐明朗,市场在大幅下跌2月余之后,随着美联储的降息救市,迅速在半年内收复了所有跌幅。
最后是2020年的新冠疫情,那是历史上最快的一次中型调整:1个月时间下跌超过32%,又迅速仅用2个月就收复失地。在过去这一代人的记忆中,并不存在新冠病毒这种高传播和高死亡率的疫情。上一次同级别的疫情还是1918年的西班牙大流感,所以当年的恐慌来得非常快。但随着紧急降息和美政府史无前例的2万亿刺激法案出台,以及疫苗研发消息的传出,美股很快又恢复了信心,创出了新高。
从以上9次纳指大中型回撤中,我们可以得出几个本质共同点:1)估值过高是大跌的“燃料堆”;2)通胀和利率上行是最常见的“引爆器”;3)突发性外部冲击(战争、疫情、金融事故)是“催化剂”;4)资本市场杠杆过高是崩溃时“杀伤增幅器”。市场往往是“依次”集齐这四大因素后发生了暴跌。一般市场先跌完了,经济才会确认衰退(GDP连续两个季度下跌)。而市场见底,也不会等到利好出现才涨,而是在“最坏的消息落地”时见底,通常还伴随着美联储或财政降息或开闸放水。最重要的是,除了3次大型回撤外,中型回撤通常在1年内,少数最长2年收复失地。
今年以来,纳指最大回撤已经高达23%,历史可能会称其为“对等关税危机”。我们看到了2万亿赤字和36万亿国债的美国政府,在特朗普第二任期中,计划通过提高关税、兜售移民金卡与吸引企业回流,来增加1万亿美元财政收入,以及通过削减国际援助开支、削减政府行政开支以及降低国债利率,来减少1万亿财政支出,以此来平衡2万亿财政赤字。这其中当然不乏受市场欢迎的政策,如放松行政管制,降低企业税率,降低市场利率,兜售移民金卡等;但其全球关税贸易战以及国际援助开支的大幅缩减,却像割了资本市场的大动脉,纳指1个多月下跌超过20%,近两日超过10%的跌幅,甚至排进了历史前5大跌幅。
我们在上个月提及了这种贸易和国际地缘政治格局大动荡所带来的风险,这其中不乏美元霸权体系解构和国际区域热战爆发的推演。但目前资本市场会有如此大的反应,现实问题还是出自特朗普个人的谈判风格。在以往的国际问题上,无论哪国政府,外交政策都是严谨和保持一定连续性的;特朗普是首个将国与国的外交政策,当成“生意”来谈的总统。就像在生意场上的相互叫价,站在自己立场上以极端开局,来回相互试探试压,最后以各自要价筹码和谈判技巧,来决定双方利益的分配。这种方式和风格,与美国一贯主张的价值观大相径庭,不可预测性极大,在容易产生“误判”的国际关系上无异于玩火。尤其是4月2日所提出的“对等关税”策略,更是朝着全球贸易秩序大微缩、引发美国输入型通胀和资金外流、企业盈利预期大打折扣的方向在发展。全世界都没适应,甚至无法理解特朗普作为总统,押上美国命运打的这场离谱桥牌。这是目前为止纳指大跌的缘由。
我们可以理解资本市场极为不安的情绪以及由此展开的想象,但当我们回顾历史上纳指的9次中大型股灾时,当下回撤又似乎与那“四大因素”貌合神离。首先,纳指估值上并没有特别离谱(像2000年、1973、1983年或2022年),我们在年初年度观点中也分析过。经过这一轮调整,一些大型科技股PE估值甚至接近22年的低点。其次,利率仍处于下行通道中,尽管今年降息节奏有些放缓,通胀也还保持3%以下水平无太大变化。在历史9次纳指大跌中,至少有7次都是发生在“通胀利率已明显上行”的阶段或尾部。再者,突发性外部冲击事件并不显著,俄乌战争和中东战争甚至在朝着终结的方向努力,尽管仍困难重重。最重要的“对等关税”危机,我们认为最后也会以单边谈判的方式结尾,最高关税落地的概率并不大,关税与顺差是手段而非目的。虽然特朗普宣布国家进入紧急状态,从而赋予自己实施这些关税的权力,但最终落地方案还是取决于两会,大家也看到了两会许多反对的声音。总统手握着的是美国的方向盘,刹车和油门则在两会脚下。最后,资本市场当前的机构和个人的杠杆率确实在相对高位,但这与历史3次大型股灾相比仍不可同日而语,经过下跌杠杆也在迅速下降。
所以,当前的调整级别,大概率不像3次大型调整;看似往中型回撤级别发展,但条件又不具足。我们可能已经过了最坏的情况,至少不远了。除非在此贸易冲突局势下,世界因为误判再起热战,否则在贸易战极端开局之后,局势会逐渐往“达成交易”的方向走。此外,人工智能也在加速进化,特朗普所推动的企业行政管制松绑、减税和降息也都在路上不远了。这些好消息在市场下跌时,往往被人无视。
经过这轮调整,那些在以肉眼可见的速度,推动着AI技术进步和应用落地的企业,估值有些也开始变得“吸引”。而这个极度不安的市场环境,也恰恰说明市场吸收了足够极端的负面假设,极端通常不会持久。就像梅花熬过了寒冬,你开始能闻得到香味,知道那不是会消融的冬雪,而是在独自盛开的花蕊。
风险提示及免责声明:市场有风险,投资需谨慎。在任何情况下,文章中的资讯仅供读者参考之用,文中提到的公司亦仅为阐述产业逻辑,所有内容均不带任何投资建议,读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的,东方港湾不负任何责任。