(文/陈济深 编辑/张广凯)
据The Information 4月17日援引四位知情人士报道,DeepSeek正洽谈首次对外融资,目标金额至少3亿美元,估值至少100亿美元。
这是DeepSeek第二次被传"首次融资"。2025年2月,DeepSeek被爆出考虑接受外部资金、潜在资方包括阿里和国资基金,DeepSeek方面当时明确定性为"纯属谣言"。
DeepSeek本次融资传闻恰逢字节首次启动豆包股回购。
4月15日,字节启动豆包股首次回购。回购价格13.08美元,较最初授予价10美元上涨30.8%。豆包股是字节2025年四季度推出的"豆包长期激励计划"的载体,一套虚拟股机制,授予对象是豆包和大模型相关业务人员,估值跟随业务基本面重估。2025年8月豆包App月活1.57亿,反超DeepSeek回到原生App首位。
4月16日,前DeepSeek研究员郭达雅加盟字节Seed团队,任agent方向负责人,整体薪资被传接近亿元。
郭达雅是GRPO算法的主要贡献者之一,这一算法是DeepSeek-R1推理能力训练方法论的核心。
当晚,抖音集团副总裁李亮在社交平台回应称"亿元年薪不实"。李亮对薪资结构进行了补充说明:字节Seed团队所有技术人员一视同仁,由现金、字节期权和豆包期权构成,期权四年期全部归属,近期没有招聘到近亿元年薪的员工。假如业务发展的很好,不排除有些Seed技术人员四年后收益会达到数亿元。
2026年初,OpenAI最新一轮融资估值高达8520亿美元、Anthropic也完成了一轮估值3800亿美元的融资。而在国内,年初智谱和MiniMax先后登陆港交所,到4月双双到了4000亿港元、折合500亿美元量级,智谱三个多月涨幅超过700%,市值已超过京东和百度。同为大模型独角兽的月之暗面估值从去年11月的40亿美元涨到180亿美元,大模型独角兽阶跃星辰也进入了上市窗口期。
这也意味着,无论放在胡润2025年全球独角兽榜把DeepSeek标为1.05万亿人民币(折合约1450亿美元)的层面,还是放在2026年的AI估值坐标系里,DeepSeek如果以100亿美元估值融资,整体估值相对偏低。
本次DeepSeek开放融资的逻辑并不难理解。
作为由幻方量化孵化,研发预算由幻方支撑。梁文锋此前在访谈中讲过,面临的问题从来不是钱,而是高端芯片被禁运。数据显示幻方2025年平均收益率56.55%,在百亿量化私募业绩榜排第二,近三年收益均值85.15%。按幻方管理规模超700亿元估算,2025年收入约超7亿美元,按这个体量支撑一家研究型AI公司的年度开支问题不大。
不过需要指出的是,DeepSeek V3论文披露的557万美元训练成本,仅涵盖V3正式训练这一轮的GPU租用开支,不包括前期架构探索、消融实验、数据处理以及其他中间模型训练的开支。V4作为万亿参数级新一代模型,训练成本大概率将明显高于V3。幻方的利润能覆盖DeepSeek过去的研发节奏,但面对V4这样更重资产的版本迭代,加上Agent、多模态等方向的并行投入,7亿美元的收入水平并不意味着可以高枕无忧。
面对行业愈发激烈的竞争,资金储备的军备竞赛下,谁也不敢豪言自己不缺钱。
阿里2025年初宣布三年3800亿元,字节2025年1500亿元、2026年计划1600亿元、其中近半用于采购AI处理器,腾讯2025年资本支出也在千亿元级别,百度AI累计投入已过1000亿元。同为独角兽的层面,智谱和MiniMax两家上市公司各自募到了几十亿港元,月之暗面最新一轮融资10亿美元,账上现金储备已过100亿人民币。
这也意味着,DeepSeek过去的"不缺钱"只是现在留在牌桌上的基本筹码,想要再进一步,幻方的量化利润输血跟大厂千亿开支及同行IPO募资的绝对量级不在一个尺度上,接受外部融资似乎合乎情理。
相比起钱的问题,而更为关键的问题还在于人心浮动,在没有明确估值甚至估值持续增长预期下,DeepSeek很容易被同行挖角高端人才。
目前顶级AI人才的争抢正在进入白热化阶段。字节给Seed技术人员的薪资结构是现金+字节期权+豆包期权,豆包股首次回购半年涨30.8%,按李亮的话四年后收益可能达数亿元。腾讯在招揽27岁的姚顺雨出任首席AI科学家后,过去一年从包括DeepSeek在内多家顶级AI厂挖走多人。
大模型独角兽上市后的财富效应也和DeepSeek的"岁月静好"形成了鲜明对比。观察者网了解到,智谱和MiniMax员工手里的期权尽管尚未解禁,但早期员工账面浮盈普遍可观,部分核心员工已经因为上市实现了财富自由。
未上市独角兽也在加大人才延揽力度。月之暗面近期推出"穿越计划",针对2027届毕业生首批16个名额,实习3到6个月通过考察后直接授予公司期权股数,本人尚未毕业也可以拿,不限专业、学历、经验。考虑到月之暗面估值的增值速度和上市预期,这份期权的潜在价值显然相比于DeepSeek的百万年薪更有吸引力。
2025年初罗福莉离开DeepSeek,后被证实加盟小米MiMo,年薪或达到千万水平;2026年4月郭达雅加盟字节Seed更是刷新了行业潜在薪资上限。他们作为DeepSeek前期核心技术人员,跳槽带来的高薪加更大的管理权限和发挥空间,对于还留在DeepSeek的员工显然是一个具体的参照系。
除了罗福莉和郭达雅两位明星研究员,DeepSeek近期已陆续失去多位核心人才。DeepSeek第一代LLM核心作者王炳宣加入腾讯,前多模态核心研究员阮翀加盟智能驾驶公司元戎启行,DeepSeek-OCR系列核心作者魏浩然春节前后离职,传闻入职某大厂。从LLM基础架构、多模态、OCR到推理、Agent,多个技术方向上都有核心人员流失。
这也意味着DeepSeek需要给员工展示自身的筹码,让留下的团队手里的纸面财富有锚。
另一个值得关注的问题是DeepSeek的发展思路和动向。进入2026年,全球AI均开始向智能体和编程发力,无论是OpenAI的Codex,Anthropic的Claude Code,还是国内的智谱、月之暗面、MiniMax均主打编程和智能体能力。DeepSeek目前主力的V3.2模型似乎依然还坚守推理模型的范畴,郭达雅转投字节也和其看好智能体方向与DeepSeek发展重心不匹配有关联。
从跑分来看,OpenAI的GPT-5.4、Anthropic的Claude(Opus 4.6/Sonnet 4.6)在第三方基准测试里代码生成能力显著超越DeepSeek V3.2,computer use和视频理解上的差距更大。智谱4月9日发布可连续工作8小时的旗舰模型GLM-5.1、MiniMax发布的M2.7、Kimi在1月发布的K2.5性能在各项性能中也都超越了DeepSeek V3.2。
不过,DeepSeek-V4即将发布的预期已经开始提前释放。
3月29日晚,DeepSeek平台曾出现持续约13小时的服务中断,业内普遍推测与V4灰度测试或全量部署相关。据悉V4将采用Apache 2.0开源协议,多家国内头部科技企业已提前采购数十万片新一代AI加速芯片,计划通过云端向市场提供V4服务,并集成至自有AI产品体系。受此带动,近期新型AI芯片市场价格较此前上涨约两成。
DeepSeek无论在用户基数还是国产生态上依然具备不可忽视的竞争力。观察者网获悉,即将发布的DeepSeek-V4没有提前给英伟达开放测试权限,优先给华为昇腾950PR和寒武纪做适配,目标是从CUDA生态整体迁移到华为CANN框架。这也意味着DeepSeek无论在开源生态还是国产自主上依然有着其强力的生态位。
对于这家曾以"东方神秘力量"惊艳全球的AI企业而言,100 亿美元的估值只是一个开始,如何在资本加持下保持技术创新的纯粹性和人才梯队的稳定性,才是更大的挑战。



































