而在一众大模型厂商中,一直略显“沉默”的字节跳动,凭借着一款豆包大模型横空出世,迅速横扫国内外一众选手,一举拿下了全球第二、中国第一的桂冠,这成绩属实让众多友商汗颜。毕竟,无论是起步时间还是储备过程,字节跳动在押注AI方面,特别是大模型方面都慢了友商好几拍。然而仅仅一年多时间,豆包就一骑绝尘,将众多对手甩到了身后,这成绩放谁也没话说。
“后来者”豆包何以后来居上?
在今年11月的AI大模型月活跃排行榜上,豆包App以5998万MAU的成绩,稳居全球第二,仅次于OpenAI的ChatGPT,在国内排名第一。而它的海外版Cici的MAU也有1267万,排在第22位。而在年初,豆包的月活跃用户数也才仅有173万。那么,作为“后起之秀”的豆包,到底是怎么起来的呢?
首先,字节跳动内部迅速统一共识,在资源、人才、机制等方面,给豆包大模型研发提供了全方位的支持。为了赶上这场AI技术革命,字节跳动迅速调整战略布局,采取一系列措施,包括大规模招募AI人才、成立专门的AI部门Flow、整合内部资源、实施赛马机制等,以加速豆包大模型的研发进程。
在一番“大力出奇迹”的操作之下,到今年3月份,豆包的下载量和月活跃用户双双登顶。到去年11月份这种趋势继续得到了延续。尽管ChatGPT仍以超3亿月活遥遥领先(APP+web用户),但豆包的崛起速度仍远超其竞争对手。国内的Kimi、文小言、通义千问等应用,在用户规模上也被豆包甩在身后,豆包甚至超过后面三者月活用户的总和。不难发现,在做豆包这件事上,字节跳动很善于把握时间窗口(善用开源资源),全方位地调动一切有利因素,将新技术迅速转变为最终成果。
其次,在具体策略上,全方位贴着对手打,核心突出一个“卷”字。随着国内百模大战的展开,围绕技术与产品的迭代速度,以及商业化效率的比拼已经全面展开。为了弥补在时间差上的不足,字节内部不惜血本,从各个方面全面开“卷”。其具体体现为,C端卷用户,B端卷价格,与对手卷算力。
比如,为了推动豆包用户的增长,字节跳动累计在C端投入不下10亿元的投流费用。这种高强度的市场投放,让豆包迅速在社交媒体、搜索引擎和短视频平台上,占据了用户的注意力,形成了强品牌记忆点。而在B端战场,豆包更是祭出了价格大杀器。在今年5月火山引擎FORCE原动力大会上,豆包Pro 32k模型正式定价是1千Tokens 0.8厘,豆包Pro 128k模型正式定价为是1千Tokens5厘钱,一口气将国产大模型的tokens定价,带到了“厘”时代。这一番颇有“气量”的降价,直接打了对手一个措手不及,逼得他们只能轮番跟进。
此外,大模型之争也是算力之争。为了确保胜出,字节跳动仅在AI上的资本开支,就达到了800亿元,这个数值接近BAT三家的总和(约1000亿元)。而根据字节最新披露的数据显示,2025年字节跳动的资本开支,还将增加到1600亿元,其中900亿元用于购置AI算力集群,700亿元用于IDC基建和网络设备。不难发现,字节跳动的饱和式攻击,正是其后来居上的核心原因。
赢家通吃模式再现大模型
随着国内大模型的持续进步,一大批国内大模型公司正在崭露头角。整个2024年,国内大模型圈子,不仅诞生了吸金200亿的大模型“六小虎”,就连一些融合AI大模型应用的AI硬件公司,都拿到了不少融资,啥都不缺的大厂表现就更好了。据公开数据显示,截至2024年11月初,百度文心大模型的日均调用量超15亿次,相较一年多前增长约30倍;截至2024年12月中旬,豆包通用模型日均tokens使用量超4万亿,较7个月前首发时增长了33倍…
不过,进入2024年下半年,风向突然骤变,曾经风头无两的大模型“六小虎”,也面临严峻的现实考验,不仅融资受阻、商业化也遭遇严峻挑战。与此同时,一批技术先进的公司快速崛起,大厂攻势日益凶猛,此消彼长的行业规律开始在AI大模型领域重现。
一方面,主流头部大厂普遍在用户、场景与算力方面,具备相对应的比较优势。比如,百度有自己的超级APP和自己的海量搜索资源,还有百度智能云等云支持;阿里有支付宝、淘宝、天猫、菜鸟等一众超级应用,更有阿里云从旁辅助;同样的优势,在腾讯与字节跳动也是不在话下。自带众多豪华资源的大厂,在做大模型过程中,更是如鱼得水。
反观很多初创公司,他们的数据资源都还需要从第三方平台获取,不仅需要大量的投流费用,还容易被对方拿捏七寸。据移动营销平台AppGrowing数据,2024年以来(截止11月15日),Kimi、豆包、星野等国内十款大模型产品,合计投放超625万条广告,投放金额达15亿元。但对于占有流量渠道的大公司而言,他们根本就不需要投入如此多的资金,仅凭自己占据的流量优势,就可以直接碾压对手。
以明星AI大模型公司Kimi为例,年初它曾在抖音、B站等内容APP上刷屏,并获取大量用户,但下半年Kimi就被限制在抖音投放,不得不转战快手等平台。据“AI新榜”公众号统计,截至10月29日,Kimi在过去三个月内的广告投放总数已经超过2500条。其中,在快手平台上投放的内容超过2100条,几乎占据总投放量的84%。在B端市场的优势,就更显著了。大厂凭借着比初创公司更低的tokens成本,互联网大厂可以迅速以极低的价格,让B端用户“尝鲜”,这些优势是那些小的初创公司所无可比拟的。
另一方面,技术先进的公司和大厂基于自身优势,在商业模式上持续挤压初创公司的生存空间。比如,卖API是不少AI大模型公司的重要生意模式。相关数据显示,OpenAI预计2024年将依靠API赚得5亿美元,占总营收的15%。据CNBC报道,Anthropic对API的依赖更大,预计总营收的60%~75%将来自第三方调用API。
然而,在国内提供大模型API,已经变成了模型厂商抢占市场的方式,并未被寄予丰厚的利润预期。2024年5月,DeepSeek推出DeepSeek-V2 ,价格直接“杀”到了每百万输入Tokens1元,每百万输出Tokens2元。随后豆包迅速跟进,将价格进一步打到了“厘”时代。面对价格战,阿里通义千问直接将价格下调了97%,百度直接宣布两款模型免费。
这样的“降价”幅度,直接将一众初创大模型公司逼到了墙角。比如百川智能创始人王小川,就表示不会跟进价格战;零一万物创始人李开复表示,“如果技术不行、单纯降价赔钱去做生意,不会有赢家。”而在大B的私有化部署方面,初创公司也不占优,目前中标的公司除了电信三巨头,就是百度、腾讯、华为、讯飞等国企和巨头,初创公司只有智谱AI的少量中标单。
不难发现,无论是在具体的技术较量还是商业化比拼方面,拥有较强技术实力或者资源的大厂,都已经在全面挤压初创公司的生存空间。照此发展下去,赢家通吃模式或将在该领域重新上演。
大模型洗牌进入加速期
正如其他新技术演变的趋势一样,大模型的上半场都是在拼命“造锤子”,即使因此造成了行业资源的浪费也再所不惜。但随着各类大模型的出现,整个市场正在快速蜕变,围绕商业化与先进技术的推广逐步提速,推动整个市场加速市场出清。
其一,技术研发开支的增大、融资的不顺,迫使各路厂商加快大模型商业化的进程。从初创公司来说,由于市场竞争格局的变化,此前在融资上一路绿灯的初创大模型公司,在年中便开始“遇冰”,输血的不足加速了初创公司的商业化进程。而在大公司方面,动辄几十上百亿的算力以及网络设施投入,虽说并不会影响其基本盘,但毕竟也是笔不小的开支。
当然,从大模型技术本身的情况来说,随着大模型推理成本的急速降低,以及轻量级大模型和MOE(混合专家模型)的日益流行,不少大模型已经实现了更低成本、更好效果的能力。
反应到落地一线,以往动辄千万元级别的单子少了,更多项目下探至两三百万元,一些单一场景的大模型应用成本甚至只需数十万元,这是尝鲜客户能接受的价格段。有人预计,到2025年随着大模型推理成本的进一步下降,大模型的落地速度会进一步加快。
反映到具体的数据上,则体现为大模型项目数量的快速暴增。根据云头条的信息,今年前11个月,大模型中标项目达到728个,是2023 年全年的3.6倍。与此同时,商业化也从粗放的面向全行业,向单一行业深度发掘;服务方式从买单走量,向“应用效果”、陪伴式服务转变。
其二,基于大模型进化的需要,没有实质性帮助的大模型将沦为可有可无的“花瓶”,丧失进化迭代能力,逐渐被用户所抛弃。经过2024一年的激战,在基础大模型层面,国内外的大模型公司已经基本定型。比如美国如今只剩下了OpenAI、Anthropic、Meta、谷歌以及xAI,在中国基础大模型,则收敛到百度、阿里、智谱、字节、讯飞、腾讯等企业。
基本上,经过一年激战,基于基础大模型的套利空间已经消失,未来想要胜出就得靠做出有影响力的AI应用。从行业来看,虽然之前业内也出现了类似AI绘画、AI作诗、AI书法等应用,但其应用场景相对狭窄,一旦用户新鲜感消失就会卸载APP,应用很快沦为“可有可无”的花瓶,丧失迭代能力。
另外,在商业能力方面,也存在预训练成本高、国外订阅模式走不通等全新的挑战。考虑到大厂与初创公司的实际状况,要应对这样的外部挑战,显然难度系数是完全不同的。如果初创公司犯了战略错误,很可能会因此被淘汰出局。可以预见,在经过了初步的“百模大战”之后,国内大模型或将迎来新的大洗牌。
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)