我们都在问,为什么大部分的人在投资里,总会错失一个个时代。是因为太多精彩纷呈的诱惑,还是短期激励与考评的限制?我们觉得,更多是没能把握住时代的主要矛盾,迷失在投资世界无限的细节与纷扰之中,纵然“持”却不能“久”,总在跌宕起伏的市场波动中与时代失之交臂。
一、 回首来势
回首2024,我们精力全部集中在了AI投资的研究上,基金也获得了不错的收益。这一年转瞬即逝,而时代的主体脉络已变得清晰可见。鉴往知来,在我们迎接2025“新赛季”之前,有必要先对过去这一年的两条时代主脉络做个总结。
第一条脉络是加速进化的AI前沿模型能力。
2024年,我们最常听到的质疑是:AI的进化“撞墙了”。但年底收官,我们可以论定,在穷尽了公开文本数据之后,科技界在多模态和逻辑推理数据上,又找到了另外两条AI能力的进化路线。
其一是AI的“多模态能力”。它允许AI能实时的接收语音与视频作为交互信息,能从视频数据中学到部分世界规则,也可以拟人的声音或电影画质的视频来表达和输出,这是AI融入人类社会的“基本接口”。随着Sora的官宣,视频生成模型大战打响了,来自中国的海螺和可灵等视觉模型,甚至以更高质量和更低成本反超了西方选手。未来,随着AI多模态能力成本的下降,使用“视觉”与“听觉”进行交互,会大面积取代“文字”交互,这是非常重要的一种AI能力的进化方向。
其二是AI的“逻辑推理能力”,这是继“直觉”能力之后的又一项模型的核心能力。o1模型的出现,使得AI不再是“一问一答”的聊天机器人,而是会对任务进行拆解、探索和反思检验的“任务机器人”,幻觉问题也得到了更进一步的解决。推理时间的“扩展定律”,也取代了模型参数的“扩展定律”,成为模型能力进化的算力投资方向。值得注意的是,推理时间的“扩展定律”进化速度甚至加快了,从o1预览版到o3 mini版之间,相隔仅仅4个月。按照Openai科学家Noam Brown说法,在通往AGI的道路上,最大的难题已经得到了解决。
另一条脉络则来自成熟模型的“降本与平权”。
相比“前沿模型的效果收敛”“收敛模型的成本下降”要容易得多,模型降本的速度有些超乎想象。按照A16Z的统计,过去两年,AI模型每百万Token的推理成本下降了3个数量级(如下图,即10%的10%的10%)。这得益于前沿模型收敛之后,全球模型研发企业的人才流动和算法平权,以及AI算力投资竞赛的遍地开花。通过对模型参数的剪枝量化,GPT4从初始1.8万亿参数下降到最新4o的几千亿参数;通过对模型矩阵运算的低秩分解,Deepseek的MLA机制允许模型运算化整为零,对内存的占用也十不存一;通过采用更多专家的MOE架构,从GPT4初始的8个专家,到Deepseek最新的V3模型已有257个专家,每次会话的激活参数大幅下降。还有来自软硬件层面的创新,包括ASIC芯片的开发热潮,跟随TPU的步伐,Trainium、Dojo、Maia等ASIC芯片都陆续问世;以及GPU不断升级的更高算力、更宽内存和更大GPU集群;还有软件层面的迭代也为AI加速,英伟达声称通过CUDA软件的创新,H100在过去1年内性能提升了5倍。
降本为AI模型的普及带来极大的推动作用。ChatGPT的周度活跃用户数达到了3亿,成为史上增长最快的应用产品,也为Openai带来1570亿美元的天价估值。而降本的另一个影响,则是模型能力的快速平权。与GPT4o同台竞争的Claude、Gemini、Llama和Xai等模型,虽然用户数仍差一个数量级,但模型能力都与Openai之间快速缩短差距;甚至于国产的字节豆包、智普GLM、阿里千问、幻方DeepSeek等AI模型,也起码在各项“开卷考”的测试中达到4o相同水平。而与Sora竞争的视频生成模型,如Runway、谷歌Veo、Meta Movie Gen,以及来自中国的快手可灵、海螺AI、字节即梦的等产品,甚至在成本和效果上都超越了Sora(因中国拥有视频数据优势,以及Openai算力资源紧缺所致)。
二、 远望前程
踏入2025,时代的这两条主脉络开始交汇,另一番图景也逐渐变得清晰 —— 世界正迈入一个“AI Agent”的时代。目前为止所有模型所训练出的知识与能力,都在为此AI应用形态的落地而做准备。沿着这条路发展下去,我们首先会在2025年,看到以下几个Agent发展的必要条件,变得更加充分,带动普及率的逐步提升。
交互能力:文本、声音与视觉等实时多模态输入、输出与转换能力,直接决定了Agent的交互能力。成熟的Agent应用,应该更多依赖于实时的语音和视觉交互和结果输出。2025年,“降本”是该能力发展的主旋律。以视频生成为例,当前的成本仍是高不可攀,Sora生成一分钟高清(1080p)视频的报价在120美金。假如全球短视频都靠模型生成,一年70亿小时的产出,线性计算成本就是8400亿美金(长度高于一分钟的视频,生成成本会非线性上涨);再考虑视频生成的成功率可能只有不到20%,那么总成本将高达4.2万亿美元,根本不切实际。即便是以成本优势领先的国产模型,例如快手可灵,生成一段5秒钟的高清视频也需要约3.5元人民币。按照Deepseek V3模型最新价格来计算,3.5元相当于约200万token的文字问答价格,或进行1000次模型对话所需成本。可见,2025年快速降低视频模型的成本,对于多模态能力的推广至关重要!
逻辑推理能力:这是Agent对任务进行拆解、探索和结果检查时的核心能力。“降本”也同样是推理能力在2025年的主旋律之一。Openai科学家 Noam Brown在12月最新采访中提到:“让AI在一手扑克牌中思考30秒,能达到将模型参数扩大10万倍相同的效果……我们未来的目标是让模型能够思考数小时、数天、甚至数周”。以当前o1每百万token输出成本60美金来衡量,随着思考时间的拉长,推理的成本会非常之高。12月o3系列模型发布时,我们在赞叹其强大性能之余,也看到了单个任务的算力成本仍不具商用价值——高强度模型完成单个任务的成本甚至高达数千美金,而相比之下,人类可能只需花费5美金。不过对此我们并不过多担心,正如前文所述,我们发现:相比“前沿模型的效果收敛”,“收敛模型的成本下降”要容易得多,而且是全球科技企业齐心协力的结果。目前推理能力仍处于最早期的发展阶段,降本提效的斜率非常陡峭,我们有信心25年的成本下行会为AI Agent的落地推广提供有效助力。
记忆与长窗口能力:更好的长短期记忆机制和上下文窗口长度,对于Agent的使用体验和使用效率至关重要,这也是2025年前沿模型能力重点开发的方向之一。想象一下,如果你新来的同事,过了一个月还是保持着第一天的记忆,你们之间的互动性和工作效率会大打折扣;对于AI陪伴类Agent,记忆与个性化更是意味着情感交互的深入程度;而虚拟助手在帮助用户进行日程安排、新闻推荐、餐厅建议等服务时,更是需要长期记忆的支持;一些复杂的任务环境里,可能需要数个小时乃至数天的推理工作,所涉及的中间工作数据,更是需要一套有效的记忆机制和更长的上下文窗口去搭配。目前的聊天机器人,通过“定制化指令”和“上下文预填充”的方式进行临时或少量的记忆,大规模应用的上下文窗口也大多在10万token的级别,但面对任务机器人Agent所需的记忆和窗口长度,我们还要在机制和硬件上进行迭代。这与两年开发逻辑推理能力相比,想让要容易得多
人类的任务行为数据:这或许是模型能力以外,关系到Agent的应用落地最重要的一项条件。从底座通用大模型,到适用于某类任务的Agent应用,需要模型学习任务的“工作流”。就像毕业生逐渐适应就业岗位的工作内容、工具使用和团队协作,这是一个微调的过程。这个学习过程,目前为止大部分是通过人类设置的“提示词工程”来完成,本质上还是人类的“手动编码”,这与深度学习的本质仍相背离。2025年,构建Agent的主流方式,可能是各个领域使用“人类完成任务的行动数据”,对底座模型进行“强化微调”来实现。(任务行为数据带着任务步骤的因果信息,是模型能力泛化的关键;而强化微调技术则是Openai在12月的技术发布会上给世界带来的最新技术)那么,摆在各行各业面前的挑战,就在于这些“人类的任务行为数据”是否准备好了。在人类工作生活的许多领域里,行为数据的采集面临着采集感应器缺失,隐私保护,数据噪声过高,数据种类多样性较低等问题。这导致了Agent应用的落地过程中,前期的行为数据积累和再组织工作,成为落地时间和效果的重要制约因素。这也导致了以此为业务的公司,例如国防领域的数据治理和AI决策龙头P公司,成为市场的香饽饽,市销率高达50倍以上。而2025年,每一家有着打造Agent业务野心的企业,都需要在人类行为数据的采集和治理上去下功夫,消费者市场也可能会出现更多的IOT硬件,为收集用户行为数据做准备。
总而言之,围绕Agent应用的构建,2025年我们会继续看到模型成本继续的大幅下降,也会看到前沿模型能力的继续提升。而Agent应用可能会在拥有人类任务行为数据的领域里,首先试水并逐步提升效果,类似于自动驾驶从L2到L5的过程。这个世界的许多商业模式也都将面临冲击或发生重构。
到目前为止,人工智能的本质还是“模拟人类”,是将所有“人类行为痕迹”,通过一定算法和算力,转变成机器可重复的“技能”。因此,在算法和算力逐步平权和普及的2025年,那些在过去业务中保留着任务行为数据的公司,最有可能诞生出Agent,成就全新的商业模式。而那些没有数据的公司,可能面临着被时代淘汰的命运。
例如,在汽车行业里,过去人类驾驶的行为痕迹大多没有被作为数据保存下来的,但电车龙头T公司用了十年,销售超过700多万电动车,并记录下了所有车主的驾驶行为痕迹,再从中评选出5星司机的优秀驾驶行为,做出了FSD驾驶软件,为公司创造了无人出租车的新业务。FSD就是一个驾驶Agent——虚拟司机。而大部分传统汽车厂商,都没有为这个即将到来的变革做足准备:当汽车使用率从现在每周10小时上升到每周100小时,使用自动驾驶的共享汽车变得普及,每年汽车销量将不可避免地出现下滑。
例如,在软件行业里,全球最大的CRM软件公司S,也是凭借过去累积的百行千业的销售与客服行为数据,做出了名为Agentforce的虚拟销售代表或客服代表,商业模式从卖软件开始转成卖虚拟员工,我们在上期观察中详细介绍过。
例如,在教培行业里,拥有“如何培养一个优秀的老师,如何设计一个有效的教案,如何因材施教的教导学生”等行为数据的教培企业,最有可能会推出AI老师。商业模式也会从过去开教学网点卖大班课,转变成在不受空间与教师资源的限制下,大规模销售1对1的AI私教课。而过去仅有题库资源的竞争对手,可能会因为没法训练优质的AI教师与课程而惨遭淘汰。
例如,在社交领域里,那些与你生活交集更广的生态平台,掌握了用户使用电脑与手机的行为数据,所推出的AI陪伴机器人或虚拟助手,会更懂用户,能够进行更深入的交流,产品粘性更强,甚至具备网络效应。值得一提的是,目前所有AI应用中,AI虚拟陪伴软件拥有最高的用户时长。第一名Character.AI最近3个月日均时长甚至高达98分钟,是ChatGPT的近9倍。随着模型多模态沟通能力的提升与降本,未来两年,AI陪伴应用会以多种形式进入你我的生活,包括不限于虚拟好友、AI玩具、AI配饰等,也有可能成为社交网络企业下一项重磅业务。
例如,在房地产行业里,中介平台公司如果拥有足够多的房产数据库,以及中介作业流程数据,完全可以推出AI中介助手,替代房产中介线上低效的重复劳动,大幅提升人类中介的人效和专业度。
例如,在广告行业里,如何为具体商家定制营销方案和广告素材,选取合适的广告对象,也是一个经验活。在最多广告行为发生的地方,会保留最多的广告行为数据,所训练出的广告营销Agent,其转化率理论上也会是最高,与流量盲目变现的商业模式,效果形成天壤之别。
相反,传统过去的商业模式中,也存在一些无法获得高质量任务行为数据的公司,可能较难诞生Agent应用。例如,互联网时代有很多非常优秀的公司和产品,实际上并不产生高质量人类行为痕迹。像导航软件、打车软件、搜索引擎,计算器等,所涉及的任务步骤较少,每一步的复杂度和自由度较低,并不存在使用产品的“经验”一说。好比你会说某人能熟悉使用excel,而不会说他熟悉地使用打车软件。因此,在AI应用的范畴里,这些产品最终会成为Agent所使用的工具、数据库与服务提供商,导致商业模式不可逆地发生一些改变。我并不是说有了人工智能,这些公司就没有价值:人们不用重新发明轮子,同理人工智能也不用放着“计算器”程序不用,每次都靠推理来算数。
三、 投资启示
尝试理解了时代的这些来龙去脉,对我们的投资又有什么启示?
第一,对于AI算力需求来说,模型降本带来的风险是次要矛盾,降本之后的AI应用的普及才是主要矛盾。至今还有很多人怀疑AI基础设施投资的合理性,其实AI投资的回报率,归根到底还是AI应用的普及度问题。如果AI基础设施投资,所服务的只是某个具体的细分行业,自然容易入不敷出。但如果服务的对象是全球所有行业和全部人口,就另当别论了。全球GDP100万亿美元,假如AI可以拉动每年经济增长1%,就足以支撑4万亿美元的AI投资(4年折旧);且在创收之外,AI也在为经济节省开支:例如,全球3000万程序员每年的薪酬约1.5万亿美元,假如AI能替代其中1/3的人工成本,就能省下5000亿美元,这还没算其他管理、销售或研发费用的节省。所以说,AI应用的普及度越广,AI基础算力的目标市场空间就越广阔,而成本下降只是普及过程的手段而已。
第二,随着AI应用的普及,AI算力全面进入“推理时代”,对高端GPU的需求可能会不减反增,这与市场担忧的“推理任务简单导致高端GPU需求下降”有所不同。首先,最新的Blackwell系列GPU,是专为推理任务而生,其独创的FP4精度,高达288GB的内存,以及72个芯片全互联的NVLink技术,使得推理任务的运行效率相较H200提升了30倍。其次,在未来Agent的工作环境中,时间逐渐拉长的思维链推理,对于芯片集群的共享芯片内存和通讯速度的要求非常高,12月刚刚推出GB300的内存设计,是迄今为止世界上唯一可以支持10万token过程推理数据的芯片。此外,当AI应用全面普及之后,用户数暴涨,任务多样性和并发数也会变得非常高,对于集群并行的需求只会越来越大。而集群是GPU的优势所在,并行计算的集群越大,加速效果越高,运行的成本就越低。再者,与ASIC对比的过程中,我们不能只看单一芯片参数或是单一任务的成本比较,GPU在通用性、集群能力和软件加速上,是提高芯片的算力使用率和并行加速效果的主要手段,对比过程不能视而不见。最后,传统大厂定制ASIC更多是战略意义,为自己在N公司产品的采购中争取话语权。ASIC芯片的设计难度不比GPU低,除了G公司从2013年(N公司当时还只是个不起眼的百亿市值企业)起耕耘出了TPU以外,其他大厂的路还很漫长,且在挑战GPU的路上还有另外两大困难:不断变化和迭代的算法(ASIC是将算法逻辑固定到电路里的芯片,算法大改,芯片作废),以及高速移动的靶点(在芯片研发领域,暂时还没有哪家公司的迭代速度跟得上N公司)。
第三,预训练以及对训练算力的需求没有停止,甚至竞争可能加剧。随着算法和算力的平权,我们甚至有可能看到第一个超越GPT4o的底座模型,出现在Openai以外的地方。预训练还没有停止,在推理时间的扩展道路之外,做大模型规模仍在继续,只是还不见第一个效果收敛的模型出现而已。这也留给了竞争对手一个超越Openai的机会,竞争的火药味只会更浓,十万卡集群依旧是竞争的起点。而数据墙可能在未来几年内见顶,但不是2025年。目前来看,首先发布前沿模型的公司拥有的品牌优势,能够快速聚拢用户。以11月份的网页端访问数据为例,ChatGPT达到近40亿次访问量,而第二名Gemini只有2.8亿次,差了一个数量级。所以,虽然“已收敛模型的降本和平权”是过去一年的主旋律,但能够在最前沿模型上超越Openai至今还无人能及,其意义和实际效果都将非常诱人。这里的竞争火药味也是预训练算力需求得以持续最重要的催化剂。
第四,B端软件可能会最先被Agent化。B端软件的功能使用起来相对复杂,所涉及工作流逻辑链条较长,数据也相对容易被留存用以微调模型,所以最容易诞生Agent。正如我们11月观点所述,软件公司的Agent化带来一种全新的商业模式——销售“虚拟员工”并以工作量定价。这会逐渐区别于当下的软件订阅付费模式,甚至因为客户裁员而导致软件订阅收入的下降,一如上个时代云订阅替代买断式付费的过程。另一方面,软件企业本身占大头的研发成本和销售成本,也会因自身使用编程Agent和销售客服Agent而逐渐下降,带来软件公司利润率普遍的上升。叠加全球软件IT采购走出周期谷底,以及整体软件估值也从底部抬头,2025年软件行业的投资机会值得重视。
第五,传统的C端软件Agent化的道路可能相对较窄,但原生的C端Agent应用可能层出不穷。C端用户付费意愿低,使用频率非常高(意味着算力成本高),且用户行为模式单调,Agent化的意义不大。正如前文所述,大部分传统C端软件未来充当的角色,可能更多是作为Agent所使用的工具、数据库与服务商。但也有某些消费者领域适合Agent化,例如游戏和电商。游戏领域里,除了制作过程会受益于AI工具的降本和加速,游戏NPC的Agent化互动也是一个可以深挖的场景;甚至会出现打破固定游戏剧情线路,场景与剧情走向完全根据互动结果而重新生成的开放性游戏。事实上,以生成式图片为场景,以文字问答进行互动的剧情游戏平台《彩云小梦》,已经可以做出Agent NPC和生成式剧情的开放性游戏。电商领域的推荐机制经过了从展示到搜索,再到信息流推荐的几轮进化迭代;如今,如何根据用户具体需求进行主动选品,也是一个可以被Agent化的任务——全能AI导购Agent。它能完全从用户需求角度出发(而不是广告角度出发),给予产品品类功能的科普,品牌特性的解释,以及匹配需求产品的推荐。这种Agent完全可以通过用户选品的行为数据和各种形态的推文训练出来。还有,我们也已经看到了一些全新的AI原生应用品类的诞生,例如AI搜索或AI知识引擎、AI短视频生成器、AI陪伴的电子宠物或AI伴侣。该等应用与某些许多互联网场景相结合,例如社交网络或短视频平台,可以创造出更多爆款产品。
第六,AI应用的机会不止于信息产业,传统领域如医疗、金融和教育等方向也会有值得投资的机会。以AI教育为例,目前的行业实践主要以学习机为载体,为学生提供习题的搜题解题、薄弱点推荐练习和作业批等功能。这些功能靠着小模型,以题库数据作为训练对象,已经存在了许多年。而在大模型能力逐渐成熟之后,AI教育的最终模式会逐渐演变成“AI教师”的Agent。事实上,ChatGPT已经成为很多人日常生活中的老师。但在义务教育阶段里,AI老师还需要依赖于教学大纲数据,教师培训数据和师生互动数据对于模型的训练微调。中国教培龙头T公司CTO田密有一个说法是,教培行业存在“个性化、大规模和高质量”的不可能三角:公司最早推出的培优小班可以做到高质量和个性化,但做不到大规模;后来做了网校,大班的方式可以做到大规模和高质量,但做不到个性化;再后来做了各种AI课,勉强可以做到个性化和大规模,但是教学质量和真人老师还是有很大的差距。AI教师Agent可以将这三者结合起来,让教育成为可高质量规模化的产业。且与真人教师相比,可以做到24小时随身教导,进行跨学科教育(知识是一种网络,连接越广,学得越好),也解决了课外辅导灰色产业的属性,商业模式彻底轻资产化,盈利方式从“卖学习机”转变成“按AI老师课时付费”。目前市场开始出现的“AI老师”雏形是“AI讲题”的功能,24年中T公司发布的九章随时问APP,不再针对习题直接给出答案,而是引导学生一步步的思考和解题。相信随着大模型推理能力的发布和飞速降本,25年AI教师的能力也会逐步得到提升。
第七,时代的脉络起源于大洋彼岸,尤其是前沿模型的探索;而降本和平权的主线,却在中华大地上此起彼伏,层出不穷。AI应用的普惠效应,或在缺乏增长点疲弱的中国经济身上,再次如互联网科技一般,重启一个新的增长引擎。12月,豆包和Deepsek V3分别的两场发布,不仅让我们看到在算力约束条件下,中国AI模型平权和降本的速度没有放缓,更重要的是,让我们嗅到了25年的AI竞争的“火药味”,中国各大科技企业正在陆续加入这场 All in AI 的竞赛。我们观察到,中国的AI龙头B公司,本月据称将在2025年向AI领域投入1300亿以上资本开支,将其AI模型的调用量提升10倍以上,同时继续降本以使多模态应用能融入自身业务。消费硬件龙头X公司,也于本月成立了AI平台部,在努力构建万卡集群的同时,挖来了Deepseek核心开发人员领导模型开发,其IOT生态也非常适合搭建Agent平台来统筹和赋能消费者,我们可以像iPhone一样,期待小爱同学的全面升级。电动车领导者L公司的CEO李想,本月也罕见地做了一期长达三小时的AI对话,核心观点是要将公司打造成一家“人工智能”企业,每年投资至少100亿去打造大语言模型底座能力,把汽车打造成“硅基家人”。甚至近两年低调沉默的社交龙头T公司,似乎也在摩拳擦掌地准备加入这场“人工智能激战”。凭借其垄断的社交关系网络、纵横交错的应用场景和长年积累的用户行为数据,T公司的AI应用落地潜力巨大,尤其在AI陪伴领域。我们期待25年这一场AI化竞争浪潮在中国的市场上,能为沉闷的经济和投资注入更多的活力。
第八,在结束思考之前,我们还需要再仔细审查下当前AI投资的市场估值和一些潜在风险。价值投资从来不是一马平川,过程中有太多是非曲折,这些可能是投资的次要矛盾,也可能会造成长期上涨过程的无数深坑。投资人也需要甄别和监视这些次要矛盾,警惕其演变成主要矛盾,对投资的确定性造成冲击,并提前做好应对预案。可以说,长期的价值投资,就是一个不断与次要矛盾抗争,牢牢守住主要矛盾的结果。
其中一个当前的次要矛盾,来自不便宜的市场估值。经过两年的上涨,美股指数当前的估值,在过去20年的历史上,显得比较昂贵。纳指100未来12月动态PE估值27倍,标普500动态估值22倍,皆高于平均水平(纳指20倍,标普16倍),临近20年来最高点(如下图)。虽然我们对于2025年的AI产业发展趋势感到乐观,但也需要对高企的市场估值抱以客观审慎态度。我们倾向于认为,在当前AI技术、经济复苏和利率下行的带动下,市场估值可能会保持高位运行;但至少在当前充满变数的国际环境中,以及日元套息利差不断缩小的全球流动性环境下,25年的市场波动可能会有所加剧,指数收益率不能期望像过去两年一样高。投资人可以考虑提高现金仓位比例,使用保护式期权,或在确定性较高、估值相对较低的投资上提高仓位,为随时可能到来的高波动市场,做好策略和心理上的准备。
另一个次要矛盾是市场所担心的美股集中度问题(如下图)。我们并不过多担忧。首先,现有龙头的集中度变化,说明的是在时代发生剧烈变化的时候,许多市值龙头企业都会被后来者所替代,就像这两年迅速崛起的算力巨头N公司。时来天地皆同力,运去英雄不自由,向来如此。投资人所需要做的,是甄别并远离那些可能逐渐被时代抛弃的旧日宠儿。其次,从全球视野来看,当前美股的集中度依然低于其他重要市场,虽然在接近历史高点,但并不一定说明什么(如下图)。
另一个次要矛盾也值得一提,存在于确定性最高的AI算力领域。过去几年,GPU龙头N公司的产品迭代速度越来越快,这是公司自20世纪90年代从游戏显卡的激烈竞争中胜出,并保持垄断地位最重要的一个优势。但在AI算力的生意里,芯片从代工厂出货后,并不能马上满足客户急迫的训练推理需求,中间还需要产业链的配套,尤其是数据中心建设的配合。因为Blackwell系列芯片在功率和用电量、散热形态、集群规模、维护难度等方面,相对于Hopper系列对数据中心都提出了更高的要求,据调研这造成了新数据中心建设进度的延迟(并不是每个数据中心都有Xai十万卡集群的建设条件和速率)。当客户数据中心建设进度落后于芯片出货进度,芯片会作为库存堆积在ODM渠道与最终用户的仓库里。虽然芯片从长期来讲依旧供不应求,但我们也要对短期库存可能造成的数个季度的短期需求下行周期,做好心理准备。
还有一个次要矛盾,存在于我们所描述的AI软件应用范式当中,从长期思考,甚至有可能演变成主要矛盾,也不得不察。传统的B端软件,本质上是企业业务流程的一种固化和自动化执行,是人类程序员历史工作的结晶。但Agent本质上是可以实时高效低成本地为业务逻辑进行编程,相对于一成不变的程序,灵活性要大幅提升,成本大幅下降。所以理论上来讲,未来企业的数据搭配底座大模型就可以调配出业务Agent,来完成企业各流程的自动化执行,传统商业软件或许完全没有存在的必要。这也是一个非常大的风险。不过到目前为止,因为B端软件公司坐拥了不止一家企业的行为数据,相对于企业用户自己微调模型,软件公司微调模型存在规模经济和技术优势,可以在末日审判来临之前,先行一步进行业务转型。抑或者,现有的B端软件灵活性虽差,也可作为固定的工具被Agent所使用,不用重复发明轮子。我们也可以拭目以待,这个繁荣了近60年的行业将会何去何从,这是个非常有趣的问题。
以上是我对2024年时代脉络的观察总结,以及2025年时代脉络的走势预测。把握住这些时代主要矛盾的来龙去脉,有助于我们坚定那些正确的判断,摈弃那些纷杂的噪声,抵制那些致命的诱惑,让投资不至于错失一个时代。
与时代和伟大企业共成长,2024年给了我们许多的收获,也让我们又一次获得了百亿私募冠军。这是连续第二年获得了冠军,两连冠也应该是创造了国内私募基金行业的历史。我们会用全部的担当和智慧,继续努力为投资人创造满意的回报!时代不息,奋斗不止!
风险提示及免责声明:市场有风险,投资需谨慎。在任何情况下,文章中的资讯仅供读者参考之用,文中提到的公司亦仅为阐述产业逻辑,所有内容均不带任何投资建议,读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的,东方港湾不负任何责任。