你光看见豆包火了！却没见豆包背后的大模型有多卷！-鸟哥笔记

而在一众大模型厂商中，一直略显“沉默”的字节跳动，凭借着一款豆包大模型横空出世，迅速横扫国内外一众选手，一举拿下了全球第二、中国第一的桂冠，这成绩属实让众多友商汗颜。毕竟，无论是起步时间还是储备过程，字节跳动在押注AI方面，特别是大模型方面都慢了友商好几拍。然而仅仅一年多时间，豆包就一骑绝尘，将众多对手甩到了身后，这成绩放谁也没话说。

“后来者”豆包何以后来居上？

在今年11月的AI大模型月活跃排行榜上，豆包App以5998万MAU的成绩，稳居全球第二，仅次于OpenAI的ChatGPT，在国内排名第一。而它的海外版Cici的MAU也有1267万，排在第22位。而在年初，豆包的月活跃用户数也才仅有173万。那么，作为“后起之秀”的豆包，到底是怎么起来的呢？

首先，字节跳动内部迅速统一共识，在资源、人才、机制等方面，给豆包大模型研发提供了全方位的支持。为了赶上这场AI技术革命，字节跳动迅速调整战略布局，采取一系列措施，包括大规模招募AI人才、成立专门的AI部门Flow、整合内部资源、实施赛马机制等，以加速豆包大模型的研发进程。

在一番“大力出奇迹”的操作之下，到今年3月份，豆包的下载量和月活跃用户双双登顶。到去年11月份这种趋势继续得到了延续。尽管ChatGPT仍以超3亿月活遥遥领先（APP+web用户），但豆包的崛起速度仍远超其竞争对手。国内的Kimi、文小言、通义千问等应用，在用户规模上也被豆包甩在身后，豆包甚至超过后面三者月活用户的总和。不难发现，在做豆包这件事上，字节跳动很善于把握时间窗口（善用开源资源），全方位地调动一切有利因素，将新技术迅速转变为最终成果。

其次，在具体策略上，全方位贴着对手打，核心突出一个“卷”字。随着国内百模大战的展开，围绕技术与产品的迭代速度，以及商业化效率的比拼已经全面展开。为了弥补在时间差上的不足，字节内部不惜血本，从各个方面全面开“卷”。其具体体现为，C端卷用户，B端卷价格，与对手卷算力。

比如，为了推动豆包用户的增长，字节跳动累计在C端投入不下10亿元的投流费用。这种高强度的市场投放，让豆包迅速在社交媒体、搜索引擎和短视频平台上，占据了用户的注意力，形成了强品牌记忆点。而在B端战场，豆包更是祭出了价格大杀器。在今年5月火山引擎FORCE原动力大会上，豆包Pro 32k模型正式定价是1千Tokens 0.8厘，豆包Pro 128k模型正式定价为是1千Tokens5厘钱，一口气将国产大模型的tokens定价，带到了“厘”时代。这一番颇有“气量”的降价，直接打了对手一个措手不及，逼得他们只能轮番跟进。

此外，大模型之争也是算力之争。为了确保胜出，字节跳动仅在AI上的资本开支，就达到了800亿元，这个数值接近BAT三家的总和（约1000亿元）。而根据字节最新披露的数据显示，2025年字节跳动的资本开支，还将增加到1600亿元，其中900亿元用于购置AI算力集群，700亿元用于IDC基建和网络设备。不难发现，字节跳动的饱和式攻击，正是其后来居上的核心原因。

赢家通吃模式再现大模型

随着国内大模型的持续进步，一大批国内大模型公司正在崭露头角。整个2024年，国内大模型圈子，不仅诞生了吸金200亿的大模型“六小虎”，就连一些融合AI大模型应用的AI硬件公司，都拿到了不少融资，啥都不缺的大厂表现就更好了。据公开数据显示，截至2024年11月初，百度文心大模型的日均调用量超15亿次，相较一年多前增长约30倍；截至2024年12月中旬，豆包通用模型日均tokens使用量超4万亿，较7个月前首发时增长了33倍…

不过，进入2024年下半年，风向突然骤变，曾经风头无两的大模型“六小虎”，也面临严峻的现实考验，不仅融资受阻、商业化也遭遇严峻挑战。与此同时，一批技术先进的公司快速崛起，大厂攻势日益凶猛，此消彼长的行业规律开始在AI大模型领域重现。

一方面，主流头部大厂普遍在用户、场景与算力方面，具备相对应的比较优势。比如，百度有自己的超级APP和自己的海量搜索资源，还有百度智能云等云支持；阿里有支付宝、淘宝、天猫、菜鸟等一众超级应用，更有阿里云从旁辅助；同样的优势，在腾讯与字节跳动也是不在话下。自带众多豪华资源的大厂，在做大模型过程中，更是如鱼得水。

反观很多初创公司，他们的数据资源都还需要从第三方平台获取，不仅需要大量的投流费用，还容易被对方拿捏七寸。据移动营销平台AppGrowing数据，2024年以来（截止11月15日），Kimi、豆包、星野等国内十款大模型产品，合计投放超625万条广告，投放金额达15亿元。但对于占有流量渠道的大公司而言，他们根本就不需要投入如此多的资金，仅凭自己占据的流量优势，就可以直接碾压对手。

以明星AI大模型公司Kimi为例，年初它曾在抖音、B站等内容APP上刷屏，并获取大量用户，但下半年Kimi就被限制在抖音投放，不得不转战快手等平台。据“AI新榜”公众号统计，截至10月29日，Kimi在过去三个月内的广告投放总数已经超过2500条。其中，在快手平台上投放的内容超过2100条，几乎占据总投放量的84%。在B端市场的优势，就更显著了。大厂凭借着比初创公司更低的tokens成本，互联网大厂可以迅速以极低的价格，让B端用户“尝鲜”，这些优势是那些小的初创公司所无可比拟的。

另一方面，技术先进的公司和大厂基于自身优势，在商业模式上持续挤压初创公司的生存空间。比如，卖API是不少AI大模型公司的重要生意模式。相关数据显示，OpenAI预计2024年将依靠API赚得5亿美元，占总营收的15%。据CNBC报道，Anthropic对API的依赖更大，预计总营收的60%～75%将来自第三方调用API。

然而，在国内提供大模型API，已经变成了模型厂商抢占市场的方式，并未被寄予丰厚的利润预期。2024年5月，DeepSeek推出DeepSeek-V2 ，价格直接“杀”到了每百万输入Tokens1元，每百万输出Tokens2元。随后豆包迅速跟进，将价格进一步打到了“厘”时代。面对价格战，阿里通义千问直接将价格下调了97%，百度直接宣布两款模型免费。

这样的“降价”幅度，直接将一众初创大模型公司逼到了墙角。比如百川智能创始人王小川，就表示不会跟进价格战；零一万物创始人李开复表示，“如果技术不行、单纯降价赔钱去做生意，不会有赢家。”而在大B的私有化部署方面，初创公司也不占优，目前中标的公司除了电信三巨头，就是百度、腾讯、华为、讯飞等国企和巨头，初创公司只有智谱AI的少量中标单。

不难发现，无论是在具体的技术较量还是商业化比拼方面，拥有较强技术实力或者资源的大厂，都已经在全面挤压初创公司的生存空间。照此发展下去，赢家通吃模式或将在该领域重新上演。

大模型洗牌进入加速期

正如其他新技术演变的趋势一样，大模型的上半场都是在拼命“造锤子”，即使因此造成了行业资源的浪费也再所不惜。但随着各类大模型的出现，整个市场正在快速蜕变，围绕商业化与先进技术的推广逐步提速，推动整个市场加速市场出清。

其一，技术研发开支的增大、融资的不顺，迫使各路厂商加快大模型商业化的进程。从初创公司来说，由于市场竞争格局的变化，此前在融资上一路绿灯的初创大模型公司，在年中便开始“遇冰”，输血的不足加速了初创公司的商业化进程。而在大公司方面，动辄几十上百亿的算力以及网络设施投入，虽说并不会影响其基本盘，但毕竟也是笔不小的开支。

当然，从大模型技术本身的情况来说，随着大模型推理成本的急速降低，以及轻量级大模型和MOE（混合专家模型）的日益流行，不少大模型已经实现了更低成本、更好效果的能力。

反应到落地一线，以往动辄千万元级别的单子少了，更多项目下探至两三百万元，一些单一场景的大模型应用成本甚至只需数十万元，这是尝鲜客户能接受的价格段。有人预计，到2025年随着大模型推理成本的进一步下降，大模型的落地速度会进一步加快。

反映到具体的数据上，则体现为大模型项目数量的快速暴增。根据云头条的信息，今年前11个月，大模型中标项目达到728个，是2023 年全年的3.6倍。与此同时，商业化也从粗放的面向全行业，向单一行业深度发掘；服务方式从买单走量，向“应用效果”、陪伴式服务转变。

其二，基于大模型进化的需要，没有实质性帮助的大模型将沦为可有可无的“花瓶”，丧失进化迭代能力，逐渐被用户所抛弃。经过2024一年的激战，在基础大模型层面，国内外的大模型公司已经基本定型。比如美国如今只剩下了OpenAI、Anthropic、Meta、谷歌以及xAI，在中国基础大模型，则收敛到百度、阿里、智谱、字节、讯飞、腾讯等企业。

基本上，经过一年激战，基于基础大模型的套利空间已经消失，未来想要胜出就得靠做出有影响力的AI应用。从行业来看，虽然之前业内也出现了类似AI绘画、AI作诗、AI书法等应用，但其应用场景相对狭窄，一旦用户新鲜感消失就会卸载APP，应用很快沦为“可有可无”的花瓶，丧失迭代能力。

另外，在商业能力方面，也存在预训练成本高、国外订阅模式走不通等全新的挑战。考虑到大厂与初创公司的实际状况，要应对这样的外部挑战，显然难度系数是完全不同的。如果初创公司犯了战略错误，很可能会因此被淘汰出局。可以预见，在经过了初步的“百模大战”之后，国内大模型或将迎来新的大洗牌。