
6 月 30 日北京硅基流动科技股份有限公司向港交所递交上市申请拟按第 18C 章特专科技公司规则在主板挂牌华泰国际和海通国际担任联席保荐人。这家 2023 年 8 月才成立的公司把自己定位成 AI 时代的Token 工厂——不训练大模型也不直接做上层应用而是把异构算力和多种开源模型打包成可计价的词元服务按量卖给开发者和企业。招股书给出的故事很性感按 2025 年词元年吞吐量计算它是中国最大的独立生态词元供应商在所有词元供应商中位列前五截至 2026 年 4 月平台注册用户超过 1000 万服务 1.3 万多家企业客户支持 170 多个模型日均词元吞吐量约 5785 亿次单日峰值突破 1 万亿。但另一组数字同样刺眼2025 年收入 5533 万元同比增长 653%净亏损却扩大到 3.45 亿元是 2024 年的 4 倍多综合毛利率从 2024 年的 39.4% 跌到 -24%相当于每收入 1 元要倒贴 0.24 元。在 B 轮后估值来到约 77 亿元的背景下这一高增长、高亏损的财务结构让市场不得不追问Token 工厂到底是不是一门好生意业务结构一条线拉估值一条线养毛利硅基流动的收入主要来自两块公有云 MaaS 服务和本地部署解决方案。公有云 MaaS规模迅速做大但严重亏钱公有云业务包括无服务器词元服务和专属实例客户按 Token 用量或固定费用付费是Token 工厂定位最直接的体现。2025 年这块业务贡献收入 2926 万元占比 52.9%首次超过本地部署成为第一大收入来源。运营数据同样夸张无服务器词元服务的客户数从 2024 年的 2455 个暴涨到 2025 年的 71.6 万个增长近 290 倍2026 年 4 月日均词元吞吐量 5785 亿次单日峰值约 1.07 万亿次。问题在于这笔账算不过来。公有云业务的毛利率约为 -119%即每收入 1 元要额外贴 1.19 元。背后的核心原因是算力租赁成本高度刚性2025 年销售成本中算力租赁接近 6000 万元占比约 87%为拉规模大量发放代金券2025 年用于免费用户的代金券对应算力成本超过 5400 万元全部计入费用不产生收入。换句话说MaaS 这条线目前更像是用真金白银换规模用来支撑中国最大独立 Token 工厂的估值叙事但短期内很难自我造血。本地部署客户变少、客单价飙升利润集中度高本地部署解决方案则是另一幅图景客户自备算力硅基流动把 SiliconLLM 推理引擎和算力编排系统部署到对方数据中心收取软件许可、实施和维保费用。2025 年这块业务收入 2607 万元占比 47.1%毛利率高达 82.5%是名副其实的利润奶牛。但细节同样值得警惕客户数量从 2024 年的 28 家减少到 2025 年的 20 家下降 28.6%单客户平均收入从 22.4 万元飙到 130.3 万元涨幅 481%。这意味着本地部署业务正在从走量转向做超大单收入越来越依赖少数高合约价值客户。一旦某个大客户预算收缩或项目延期对整体营收的冲击会被显著放大。同时本地部署本质上是项目制交付周期长、复用率有限规模化天花板明显。从收入结构变化看2024 年本地部署收入 627.7 万元公有云仅 106.9 万元本地部署是绝对主力到 2025 年公有云收入反超至 2926 万元两者才趋于平衡。也就是说Token 工厂的故事主要是在 2025 年这一年集中讲出来的时间窗口并不长而亏损扩大也主要发生在公有云快速扩张的过程中。为什么 Token 工厂越卖越亏MaaS 业务收入增速 653%亏损却同步放大根源在于成本结构和产业位置。1研发和算力成本双重挤压2025 年硅基流动研发费用达到 2.09 亿元是当年收入的近 4 倍研发投入合计三年约 2.84 亿元。这些钱主要投向 SiliconLLM 引擎迭代、多芯片适配、调度系统优化等属于 AI Infra 的典型重研发特征。更关键的是算力成本2025 年销售成本 6863 万元其中算力租赁接近 6000 万元占比约 87%为承接推理需求爆发公司提前锁定了英伟达、昇腾、壁仞、沐曦、摩尔线程等多品牌 GPU但 Token 产量是变量租卡费却是固定成本。当调用量不如预期时单位 Token 成本会被显著拉高为填满产能只能继续烧钱换客户形成规模越大、亏损越重的短期悖论。2生态位劣势没有云、没有模型只剩中间层和火山方舟、阿里百炼、百度千帆不同硅基流动没有自研大模型也没有云生态可以交叉补贴。大厂可以把 MaaS 当成引流入口用云存储、数据库、老客户合同来补贴亏损而硅基流动的代金券和低价策略更多是纯成本很难通过其他业务回收。供应链上它又是纯粹的租卡方。2025 年阿里和华为哈勃分别向其供应算力采购金额分别为 1970 万元和 1262 万元合计占采购总额近 20%而阿里百炼、华为云 MaaS 又恰恰是其在公有云 MaaS 市场的直接竞争对手。这意味着一部分烧钱换量的租卡成本直接流进了竞对的口袋在价格战中硅基流动既没有模型定价权也没有芯片定价权只能被动跟随开源模型和云厂商的节奏。向下看它没有自研模型只能依赖开源模型生态一旦某个模型方或芯片厂商推出足够便宜、好用的官方 MaaS客户完全可以直接对接独立第三方中立这一卖点就会被部分绕开。77 亿估值市场在赌什么在 B 轮后硅基流动估值约 77 亿元对应 2025 年收入的 PS 高达 140 倍远高于海外同类 MaaS 玩家如 Fireworks AI、Together AI 的 PS 大致在 30–50 倍区间。如此高的溢价本质上是在押注两个时间差。1国产算力需要一个通用中间层昇腾、壁仞、沐曦、摩尔线程等国产 AI 芯片出货量快速增长但各家软件接口、编译器、驱动并不统一大厂云通常只深度适配自家芯片模型方若想跨多品牌芯片部署成本很高。硅基流动的 SiliconLLM 引擎试图充当这个通用中间层屏蔽不同芯片的差异提供统一推理接口通过任务拆分、缓存复用、预测解码等技术提升单卡效率让模型方和应用方不必逐一对接每家芯片厂商。如果这套中间层真正跑通硅基流动的价值就不只是一家 MaaS 公司而是嵌入国产算力生态的关键环节这构成了估值溢价中最具想象空间的部分。风险在于国产芯片厂商完全可能自己补齐这一层推出成熟的统一软件栈一旦昇腾、壁仞等把芯片 软件栈 MaaS打包好硅基流动的中间层价值可能被直接替代。2中立带来的短期窗口在大模型竞争激烈的环境下一些模型方不愿把推理放在有自研模型的大厂云上担心调用数据被用于训练竞品。硅基流动强调模型中立、不训练自有大模型在一定程度上缓解了这种顾虑吸引了一部分对数据安全敏感的客户提供推理需求。但这一优势同样面临挑战没有自研模型就没有模型即流量的入口效应只能被动接受开源模型的价格带一旦国产芯片厂商或头部模型方推出足够便宜、稳定的官方 MaaS中立第三方的差异化会被削弱。从股东结构看硅基流动的资本阵容几乎是一张Token 产业链地图阿里、华为哈勃、美团、创新工场、商汤、智谱、壁仞等既有算力/芯片方也有模型/应用方还有云和产业资本。对部分股东而言即便独立中间层最终不是最优形态只要 Token 生产这个环节跑起来也能通过股权分享收益。财务与治理高研发投入下的未商业化上市硅基流动 2023 年 8 月成立2023 年 8 月至 12 月收入仅 6000 元2024 年和 2025 年收入分别为 734.6 万元和 5533 万元。同期净亏损分别为 1222.3 万元、8191.5 万元和 3.45 亿元亏损持续扩大。研发开支增速明显快于收入2023 年 8 月至 12 月1084.1 万元2024 年6447.5 万元2025 年2.09 亿元。截至 2025 年末公司拥有 100 名全职员工其中研发人员 67 人占比 67%在中国拥有 11 项注册专利、34 项专利申请及 17 项软件著作权。股权结构上创始人袁进辉直接持股 14.35%并通过四个员工激励平台合计控制约 44.48% 投票权。外部机构股东中阿里系持股 7.42%为最大外部股东华为哈勃、创新工场分别持股 4.07% 和 4.01%。2025 年关键管理层薪酬总额 5795.4 万元大幅增加主要受股份支付影响。由于尚未达到港交所第 18C 章商业化公司的收入门槛硅基流动此次以未商业化特专科技公司身份申请上市发行规模、发行价及拟募资金额尚未披露。真正的问题在时间差耗尽前把产能利用率拉起来硅基流动当前的打法可以概括为用公有云 MaaS 拉规模和估值用本地部署养毛利和现金流。但长期看MaaS 才是估值的核心如果这条线始终无法扭亏整个商业模式的可持续性都会被打上问号。招股书显示截至 2025 年末公司账面现金及等价物为 1.72 亿元再加上 2026 年 6 月完成的超 20 亿元 B 轮融资短期资金压力不大。真正关键的是在国产芯片自研软件栈成熟、竞争对手补齐中立 MaaS能力之前把已有算力的利用率拉起来让 70 多万付费客户中足够多的部分转化为高频、持续调用从而摊薄单位 Token 成本。Token 工厂不是不能做而是难在三点1如何在没有云和模型生态的情况下构建真正的成本优势2如何把免费 代金券拉来的规模转化为可持续的付费和活跃3如何在国产芯片和大厂云的双重挤压下守住通用中间层 中立的窗口期。硅基流动此次递表等于把这道题摆到了公开市场面前在时间差耗尽之前它能否证明独立 Token 工厂不是一门越卖越亏的生意而是一条可以持续盈利的 AI 基础设施赛道。