DeepSeek / 幻方量化独立深度调研:效率型开源模型组织如何走向 AI 基础设施
元数据:调研模式 deep-redo · 数据截至 2026-06-08 · 重做时间 2026-06-08 20:50:00 · 本版按独立专题重构,不沿用上一版横向对比模板。
参考来源:DeepSeek 官方、API 文档、透明度中心、幻方官网、V2/V3/R1 论文与 GitHub、梁文锋采访、合规条款和媒体报道等 · 共引用 21 个来源
核心判断:DeepSeek 的独特性不是单次模型领先或低价 API,而是幻方量化供血、本土研究组织、开源效率路线和工程成本优势共同形成的复合系统;它已经证明效率可以改变全球模型价格和技术叙事,下一步必须证明自己能成为可靠、合规、可持续的 AI 基础设施。
一、总判断:DeepSeek 的特殊性不是低价,而是“研究组织 + 工程效率 + 开源扩散”的组合
核心判断:DeepSeek 不是典型 VC 驱动的大模型公司,也不是单纯 API 服务商,而是由幻方量化长期 AI 基础设施和现金流支撑的基础模型研究组织。
DeepSeek 最容易被外界记住的是低价、开源和 R1 爆发,但如果只从产品层看,会错过它真正的特殊性。DeepSeek 的底层结构是:幻方量化长期建设 AI 算力和工程系统,梁文锋以量化基金现金流和研究预算支持基础模型研发,团队以本土年轻研究员为主,技术路线围绕稀疏化、低成本训练、推理效率、开源扩散和 API 普惠展开。[10][16][17]
这使 DeepSeek 和普通创业公司不同。许多 AI 公司先融资,再买算力,再找商业化;DeepSeek 更像先有一个 AI 量化基础设施和现金流母体,再孵化基础模型研究。幻方官网披露的萤火二号、任务级分时调度、3FS、算子库和集群使用率,说明它在 DeepSeek 出圈前就有长期 AI 工程积累。[10]
DeepSeek 的技术路线也不是“参数越大越好”。V2 用 MLA 和 DeepSeekMoE 降低 KV Cache 和推理成本;V3 用 671B 总参数、37B 激活、FP8、MoE、MTP 和 2.788M H800 GPU hours 建立效率叙事;R1 通过 RL 把开源推理模型推向全球认知;V4 又把百万上下文、Agent、低价 API 和国产芯片适配推向基础设施阶段。[3][5][11][12][14]
本报告的核心判断是:DeepSeek 的护城河不是闭源模型,也不是一次跑分领先,而是组织、算力、工程效率、开源生态和低价 API 共同形成的复合系统。它已经证明中国团队可以用效率路线改变全球模型价格和技术叙事;但它还需要证明自己能从研究组织升级为可信赖的全球 AI 基础设施公司。
二、幻方供血:DeepSeek 的起点不是融资,而是量化基金的 AI 基础设施
核心判断:幻方量化给 DeepSeek 提供的不只是钱,而是算力、工程文化和“用 AI 解决复杂问题”的组织前史。
幻方官网把自己定义为“使用 AI 进行投资的对冲基金”和“AI 基础科学研究”组织,披露了萤火二号训练平台、3FS 文件系统、任务级分时调度、hfai.nn、hfreduce 等基础设施。[10] 这些内容说明,DeepSeek 不是从零开始搭建 AI 工程能力,而是继承了量化交易时代对算力、分布式系统、调度和高性能计算的长期投入。
量化基金供血有两个重要后果。第一,DeepSeek 早期可以不完全受 VC 融资节奏约束。梁文锋在采访中提到,资金来自幻方研发预算,不急于应用商业化,目标指向 AGI 和基础模型。[16] 这种结构让团队可以把资源投入模型效率、训练系统和研究问题,而不是过早围绕收入 KPI 设计产品。
第二,量化背景塑造了 DeepSeek 的工程偏好。量化交易天然重视效率、吞吐、成本、自动化和系统稳定,这些偏好迁移到模型研发,就表现为 MLA、MoE、FP8、缓存、低价 API 和开源推理优化。DeepSeek 的效率路线不是营销口号,而有组织土壤。
但幻方供血也有风险。DeepSeek 的独立性和长期预算,某种程度上依赖幻方业务稳定。如果量化收益下降、监管环境变化或资源投入优先级改变,DeepSeek 的研究节奏可能受影响。外部融资传闻出现,也说明单靠母公司供血可能已经不能完全覆盖下一阶段算力、人才和基础设施化需求。[18]
三、梁文锋方法论:低价、开源和本土团队不是偶然选择
核心判断:DeepSeek 的产品策略与梁文锋公开表达高度一致:重研究、重效率、低价普惠、开放扩散、本土团队。
梁文锋采访中有几个高频信号:资金来自幻方研发预算;API 不贴钱也不暴利;V2 团队没有海外回来的人,都是本土人才;组织自下而上,调用卡和人不设上限;目标是 AGI,而不是先做应用商业化。[16][17] 这些信息解释了 DeepSeek 为什么会选择低价和开源。
低价不是单纯补贴,而是技术路线的外显。如果模型结构和推理系统能显著降低成本,那么低价 API 就不只是市场策略,而是把效率优势转化为用户可感知价值。DeepSeek V2 之后国内模型价格战被重新定价,说明它确实改变了行业价格锚。[11]
开源也不是单纯获取声量。对 DeepSeek 来说,开源带来三种收益:第一,吸引全球开发者和研究者验证模型;第二,推动云厂商、推理框架和国产芯片适配;第三,扩大 DeepSeek 作为基础模型的事实标准影响力。R1 开源后引发全球关注,说明这个策略有效。[14][15]
本土年轻团队则让 DeepSeek 形成独特文化。相对成熟大厂,年轻团队路径依赖更少,愿意重写训练系统和尝试非主流优化;相对海外团队,本土团队更适合在国内算力、国产芯片和政策环境下做工程适配。但这也带来组织风险:人才容易被挖,管理经验不足,基础设施化后需要更多安全、法务、客服和企业支持能力。
四、V2 到 V4:DeepSeek 的主线是效率不断变成战略武器
核心判断:DeepSeek 的模型路线不是线性堆参数,而是一次次把工程效率转化为市场影响。
V2 是战略转折点。论文显示,DeepSeek-V2 使用 MLA 和 DeepSeekMoE,236B 总参数、21B 激活、128K 上下文,相比 DeepSeek 67B 节省 42.5% 训练成本,KV Cache 降低 93.3%,最大生成吞吐提升 5.76 倍。[11] 这些数字解释了为什么 DeepSeek 能发起价格冲击:不是简单赔本卖,而是结构上更便宜。
V3 把效率叙事推到更大规模。GitHub 和论文显示,V3 采用 671B 总参数、37B 激活、14.8T tokens、2.788M H800 GPU hours,并使用 MLA、DeepSeekMoE、辅助损失无关负载均衡、MTP、FP8 混合精度等技术。[12][13] V3 的意义在于证明较低训练成本也能做出强模型,从而冲击“只有巨额算力投入才能领先”的行业叙事。
R1 是认知转折点。R1/R1-Zero 使用大规模强化学习,强调推理能力可以通过可验证奖励学习出来,而不完全依赖人工标注推理轨迹。[14][15] 这让 DeepSeek 从“便宜好用的中国模型”变成全球推理模型讨论里的核心变量。开源 R1 和蒸馏模型进一步扩大了影响。
V4 则进入基础设施阶段。官方发布说明称 V4 Preview 包含 V4-Pro 和 V4-Flash,支持 1M 上下文、DSA 稀疏注意力、Agent 能力优化、OpenAI/Anthropic API 支持,并给出极低 API 价格。[3][5] 这说明 DeepSeek 已经不只是发布模型,而是在搭建长上下文、低价、Agent 和兼容生态的服务平台。
五、低价 API:DeepSeek 改变的是行业价格锚,不只是收费表
核心判断:DeepSeek 的低价 API 是效率路线的市场化表达,也可能成为基础设施化的压力源。
DeepSeek API 价格页显示,V4-Flash 和 V4-Pro 均支持 1M 上下文、384K 最大输出,并兼容 OpenAI/Anthropic 接口。V4-Flash cache hit 价格低至每百万 tokens 0.0028 美元,cache miss 0.14 美元,output 0.28 美元;V4-Pro 也维持较低价格。[3] 这种价格结构把 context caching 的价值直接传导给开发者。
低价有战略意义。第一,它扩大模型使用量,让 DeepSeek 成为开发者默认测试对象。第二,它迫使同行降价,重置国内外模型服务价格锚。第三,它让企业和个人更容易把大模型嵌入产品。第四,它配合开源形成双重扩散:能本地部署的人用权重,想省事的人用 API。
但低价也是压力源。基础设施公司不能只追求便宜,还要提供稳定 SLA、客服、安全、合规、账单、速率限制、故障恢复和企业支持。DeepSeek 状态页显示 API 可用性较高,但 Web Chat 可用性低于 API,历史上也有攻击、注册限制和长时间 outage 报道。[6][18] 如果企业把 DeepSeek 当关键服务,低价之外必须有可靠性。
因此,DeepSeek 的下一阶段不是继续降价,而是证明“低价也可靠”。如果能做到,它会成为全球 AI 基础设施的重要一极;如果低价伴随不稳定和支持不足,企业客户会把它视为实验或备选,而非主路径。
六、开源效率:DeepSeek 把影响力交给社区,也把护城河变薄
核心判断:开源让 DeepSeek 快速扩散,也迫使它不能靠封闭模型建立传统护城河。
DeepSeek 的开源策略非常激进。V3、R1 等模型通过 GitHub、Hugging Face、论文和模型卡公开,代码和模型许可支持商用或较宽松使用。[12][14] 这让全球开发者、云厂商、推理框架、国产芯片厂商和研究者都能快速接入。
开源带来的第一层价值是验证。模型能力不再只靠官方榜单,而是由社区复现、部署、蒸馏和二次开发验证。第二层价值是适配。各种推理框架、芯片、云服务和应用可以围绕 DeepSeek 做优化。第三层价值是声誉。R1 的开源扩散让 DeepSeek 成为全球 AI 讨论中心。
但开源也削弱传统商业壁垒。别人可以下载权重、蒸馏模型、部署私有版本,企业也可能只用 DeepSeek 的开源成果而不付 API 费用。DeepSeek 必须用更快迭代、更低成本、更好服务、更强工具和生态兼容性维持优势。
换句话说,DeepSeek 的护城河不是“别人拿不到模型”,而是“别人即使拿到模型,也难以复制它持续产出低成本强模型的组织系统”。这让 DeepSeek 更像 Linux/PyTorch 式基础生态,而不是传统 SaaS 公司。
七、国产芯片适配:DeepSeek 可能成为中国 AI 软硬协同的标杆负载
核心判断:DeepSeek 对国产芯片生态的价值,可能大于单个应用市场价值。
DeepSeek 模型开源和低价 API 的外部性之一,是推动国产芯片适配。V3、R1 到 V4 相关报道显示,华为昇腾、寒武纪、海光、摩尔线程、沐曦、昆仑芯等厂商都在围绕 DeepSeek 模型进行适配。[19][20] 这些信息部分来自媒体和厂商公开动作,需要继续交叉验证,但趋势非常明确:DeepSeek 已成为国产 AI 芯片生态的重要工作负载。
这件事的意义不只是“能在国产卡上跑”。真正重要的是:DeepSeek 的 MoE、稀疏注意力、长上下文、低精度推理和大规模并发,正好覆盖国产 AI 芯片最需要证明的能力。厂商如果能把 DeepSeek 跑好,就能向市场证明自己的推理框架、算子、显存管理、通信和稳定性。
对 DeepSeek 来说,国产芯片适配也是战略安全垫。面对英伟达芯片限制和全球供应链不确定性,能在多种国产硬件上部署,意味着更强的供应弹性和国内企业采用便利。对中国 AI 产业来说,DeepSeek 可能成为类似“事实标准模型负载”的角色。
但适配不能只看 Day-0 宣传。企业真正关心的是吞吐、延迟、成本、稳定性、工具链、调试体验、生态成熟度和长期维护。国产芯片能不能承接 DeepSeek 的基础设施化需求,还需要更多生产环境数据。
八、透明度与合规:DeepSeek 已有框架,但离企业级信任仍有距离
核心判断:DeepSeek 在模型透明度上进步明显,但企业级合规、隐私和服务承诺仍需加强。
DeepSeek 官方站已提供透明度中心、模型卡、技术报告、API 文档、服务状态、隐私政策、用户协议和开放平台条款。[1][2][7][8][9] 这比许多只给模型入口的公司更完整。透明度中心列出主要模型、发布时间和技术报告;状态页披露 API 与 Web Chat uptime;条款说明数据、服务、责任和下游开发者义务。
隐私政策显示,DeepSeek 可能收集账号信息、用户输入、上传文件、聊天历史、设备/网络、日志和 IP 近似位置等。[8] 对个人用户这属于常见 AI 服务口径;对企业、政府、金融、医疗和跨境业务,则必须做更严格评估。开放平台条款也明确,下游应用需要自行履行个人信息告知、同意、权利响应和安全措施。[9]
服务条款还说明,DeepSeek 可变更、暂停或终止服务,不保证所有司法辖区可用。[7] 这对开发者和企业很重要:如果把 DeepSeek API 接入关键业务,就必须考虑备份模型、SLA、合规审计和故障切换。
因此,DeepSeek 的透明度是“研究与开发者级别逐步完善”,还不是“全球企业基础设施级别完全成熟”。下一步需要更清楚的数据处理选项、企业 SLA、私有化/专有部署条款、安全认证、区域合规和客户支持体系。
九、外部融资传闻:研究组织是否进入公司化拐点
核心判断:如果外部融资落地,DeepSeek 的叙事会从“幻方供血的研究组织”转向“资本参与的基础设施公司”。
外部融资传闻称 DeepSeek 可能寻求首次外部融资,目标估值不低于 100 亿美元、融资至少 3 亿美元。[18] 该信息未获 DeepSeek 官方确认,必须谨慎处理。但无论传闻是否落地,它都揭示一个现实:DeepSeek 下一阶段可能需要更多资金、治理和商业化能力。
融资动因并不难理解。V4/V5 继续训练需要算力,国产芯片适配需要工程投入,全球 API 需要服务基础设施,企业客户需要支持团队,安全合规需要法务和审计,核心人才也需要长期激励。幻方供血模式虽然独特,但基础设施化阶段的资金和组织要求可能远超研究阶段。
融资的好处是增强资源。外部资本可以帮助 DeepSeek 建立全球服务、企业销售、合规体系和人才激励。坏处是引入退出压力和商业 KPI。梁文锋公开表达中强调长期研究和自下而上文化,外部股东可能改变这种节奏。[16]
因此,融资若发生,不应简单解读为利好或利空。它代表 DeepSeek 从研究组织走向基础设施公司的拐点。关键看资本是否尊重其研究文化,是否帮助补齐公司能力,而不是迫使它过早追求短期营收。
十、结论:DeepSeek 的下一题不是模型发布,而是可信基础设施
核心判断:DeepSeek 已经证明效率和开源可以改变行业,下一步要证明可靠性、合规和组织规模化。
重做后,DeepSeek 的独特性应该从“便宜模型”提升为“效率型基础模型组织”。它的核心资产是幻方供血、梁文锋方法论、本土研究团队、工程效率、开源扩散、低价 API 和国产芯片适配。V2、V3、R1、V4 不是孤立模型,而是一条效率不断外显为战略影响的路线。
DeepSeek 已经改变三件事:第一,它让全球重新评估中国模型的技术上限;第二,它把开源推理模型推到前沿讨论;第三,它把 API 价格和国产软硬协同推入新阶段。
但它还要证明三件事:第一,低价 API 能否长期稳定;第二,开源生态能否反哺收入和企业信任;第三,研究组织能否补齐安全、合规、SLA、客户支持和全球服务能力。DeepSeek 的未来不取决于下一次发布是否再度震撼,而取决于它能否让企业和开发者放心把关键工作负载交给它。
十一、V2/V3/R1/V4 的连续性:DeepSeek 不是突然爆红,而是效率路线逐层外显
核心判断:DeepSeek 的每一代关键模型都在回答同一个问题:如何用更低成本实现更强能力,并把效率转化为生态影响。
V2 回答的是“推理成本能不能大幅下降”。MLA 降低 KV Cache,MoE 降低激活参数,吞吐提升让低价 API 具备技术基础。[11] 这一步让 DeepSeek 从研究项目变成行业价格变量。
V3 回答的是“低成本能不能做大规模强模型”。671B 总参数、37B 激活、FP8、MTP、2.788M H800 GPU hours,这些信息共同构成 DeepSeek 的工程效率叙事。[12][13] 它挑战了行业对训练成本的直觉:不是只有最大预算才能做出前沿模型。
R1 回答的是“开源推理模型能不能进入全球前沿讨论”。R1-Zero 与 R1 的 RL 路线、冷启动和蒸馏模型,让 DeepSeek 从国内价格战走向全球认知战。[14][15] R1 最重要的影响不是某个榜单,而是让大量研究者和开发者重新思考推理能力的训练路径。
V4 回答的是“DeepSeek 能不能成为基础设施”。1M 上下文、DSA、Agent 能力、V4-Pro/V4-Flash、OpenAI/Anthropic 兼容接口和低价 API,都是基础设施公司需要的能力组合。[3][5] 这条线索说明,DeepSeek 的技术迭代不是孤立爆点,而是持续把效率扩散到模型、API、开源和硬件生态。
十二、企业采用 DeepSeek 的真实顾虑:强模型之外还有五道门槛
核心判断:企业不会只因为模型强或便宜就把关键业务交给 DeepSeek,还要看安全、合规、SLA、支持和可控部署。
第一道门槛是数据。DeepSeek 隐私政策显示服务会处理用户输入、上传文件、聊天历史、设备信息和日志等。[8] 企业若输入合同、代码、客户数据或业务文档,必须明确数据是否训练、存储多久、在哪个司法辖区、如何删除、是否支持私有化或企业隔离。
第二道门槛是 SLA。低价 API 很吸引人,但企业关键业务需要稳定性、错误率、延迟、配额、故障通知和赔付机制。状态页是进步,但与成熟云服务 SLA 仍有差距。[6]
第三道门槛是合规。金融、医疗、政务、教育、跨境企业使用 AI 服务,需要内容安全、隐私、审计、访问控制、日志留存和模型输出责任。DeepSeek 的条款把部分下游责任交给开发者,这对平台合理,但企业仍需独立评估。[7][9]
第四道门槛是支持。开源社区可以解决很多技术问题,但企业客户需要工单、客户成功、架构支持、迁移方案和事故响应。DeepSeek 若要基础设施化,必须从研究团队扩展出服务组织。
第五道门槛是可替代性。开源降低了采用门槛,也降低了 API 锁定。企业可能本地部署 DeepSeek 权重,也可能在云厂商上调用蒸馏版本。DeepSeek 要获得收入,需要证明官方 API 或官方服务比第三方部署更稳、更快、更安全。
十三、国产芯片适配的深层意义:DeepSeek 正成为算力生态的共同语言
核心判断:DeepSeek 的开源模型给国产芯片厂商提供了统一试金石,也让模型公司和硬件公司形成相互验证。
国产芯片最缺的不是单次 demo,而是稳定、复杂、真实、有开发者需求的工作负载。DeepSeek 正好提供这种负载:MoE、长上下文、推理优化、低价大流量、R1 推理、V4 Agent 和百万上下文。厂商若能让 DeepSeek 跑得好,就能证明自己的编译器、算子、通信、显存和框架成熟度。[19][20]
这对中国 AI 生态有放大效应。过去国产芯片常被 CUDA 生态压制,缺少统一应用牵引。DeepSeek 开源后,芯片厂商、云厂商、框架团队和企业客户都围绕同一个模型做适配,生态协同效率会提高。DeepSeek 不一定直接从每次适配中赚钱,但它会成为软硬件协同的中心节点。
风险在于,适配宣传容易高于真实生产效果。Day-0 能跑不代表成本、延迟和稳定性优于成熟 GPU;BF16 转换、FP8/FP4 支持、稀疏 Attention、MoE 通信都会影响最终效率。DeepSeek 若要深度绑定国产芯片,需要公开更多 benchmark、最佳实践和企业案例,否则适配价值会停留在公关层。
十四、DeepSeek 的组织转型:研究文化如何不被基础设施化吞掉
核心判断:DeepSeek 最大的中长期难题,是在保持研究速度的同时建立企业级组织能力。
研究组织追求探索、速度、低层级和高自由度。基础设施公司追求稳定、流程、合规、安全和客户承诺。DeepSeek 现在正站在两者之间。它的成功来自前者,但未来收入和企业采用需要后者。
如果 DeepSeek 过度公司化,可能削弱自下而上的研究文化,降低探索效率。若继续保持纯研究组织,又难以支撑全球 API、企业客户、合规审计、服务稳定和安全响应。外部融资传闻之所以重要,不只是钱的问题,而是组织形态的问题。[18]
最理想的路径,是把研究核心和基础设施团队分层:研究团队继续保持高自由度,平台团队负责 API、SLA、安全、文档、客户支持和企业交付。开源社区继续扩大外部适配,官方服务负责可靠性和合规。只有这样,DeepSeek 才能避免在商业化中失去研究优势。
DeepSeek 的最终考验,不是下一代模型是否再度惊艳,而是它能不能长期把惊艳模型变成可信服务。研究能力让它赢得注意力,基础设施能力才会让它赢得企业预算。
十五、DeepSeek 的深水区:开源之后,官方服务还凭什么收费
核心判断:DeepSeek 越开源,越要回答官方 API 和官方平台的不可替代性;否则影响力很大,但收入未必归自己。
DeepSeek 的开源策略带来了巨大影响力,但也制造了商业化悖论。模型权重开放以后,云厂商、推理平台、企业私有化团队和开发者都可以部署 DeepSeek 或其蒸馏版本。[12][14] 这会让 DeepSeek 的生态扩散非常快,却不必然让收入回到 DeepSeek 官方账户。开源模型的商业化问题,正在于“使用越广泛,价值捕获越难”。
官方 API 要收费,必须提供第三方部署难以替代的东西。第一是最新模型优先使用。若 V4、V5 或更强版本总是官方 API 最先稳定上线,开发者会愿意付费。第二是更低总成本。官方若有更好的缓存、批处理、调度和硬件优化,就能比自建更便宜。第三是更稳定服务。企业不愿自己运维大模型时,会为 SLA 和故障支持付费。第四是合规和安全。若官方能提供企业隔离、审计、数据处理选项和私有部署,收入空间会更大。
DeepSeek 当前已经具备一部分条件:API 低价、OpenAI/Anthropic 兼容、状态页、透明度中心和开放平台条款。[2][3][6][9] 但这些还只是基础。要成为真正基础设施公司,它还需要更强的企业服务层:专属实例、区域部署、数据不留存选项、SLA、账单管理、团队权限、监控、技术支持和安全认证。
如果 DeepSeek 不能补齐官方服务价值,它可能成为“全球最有影响力的开源模型之一”,但商业收入被云厂商和第三方平台分走。反过来,如果它能让官方 API 成为最便宜、最新、最稳、最合规的 DeepSeek 使用方式,开源就不是收入损失,而是获客和生态扩散。DeepSeek 的商业命题正在这里:用开源赢世界,用官方服务收回价值。
十六、国际信任问题:DeepSeek 越像基础设施,越会被用安全标准审视
核心判断:DeepSeek 的全球影响力越大,围绕数据、审查、供应链和公共部门使用的争议就越难回避。
R1 之后,DeepSeek 不再只是中国开发者使用的模型,而成为全球用户、企业和政府都关注的基础模型。影响力提升后,评价标准会变化。普通用户关心好不好用、便不便宜;企业关心数据和 SLA;政府部门关心供应链、数据主权、内容安全和地缘政治风险。DeepSeek 的隐私政策、服务条款和透明度中心已经给出基础框架,但还不足以消除国际市场疑虑。[2][7][8]
国际信任的核心不只是“数据是否安全”,而是“能否被审计”。企业和公共部门会问:输入数据是否用于训练?日志保存多久?是否支持区域化部署?是否能提供模型版本锁定?是否有内容过滤说明?发生安全事件如何通知?是否有第三方安全认证?这些问题如果没有标准答案,DeepSeek 即使模型便宜,也难以进入高敏感行业主路径。
这也是开源的双重作用。开源提升透明度,让外界可以检查模型和部署;但官方云服务仍然涉及数据处理、接口可用性和运营主体。许多海外客户可能愿意本地部署 DeepSeek 权重,却不愿直接使用官方 API;这会扩大生态影响力,但削弱官方收入捕获。
因此,DeepSeek 的全球化不是简单拓展市场,而是建立信任基础设施。它需要在模型透明度之外,补齐安全白皮书、企业隐私选项、私有化部署、审计日志、服务等级、地区合规和事件响应。只有这样,它才能从“全球开发者喜欢的开源模型”升级为“全球企业敢用的基础设施”。
参考来源
[1] DeepSeek 官网:公司主体、产品入口、V4 预览、API 与透明度入口。打开来源
[2] DeepSeek 透明度中心:模型发布时间、模型卡和技术报告。打开来源
[3] DeepSeek API 价格页:V4-Flash/V4-Pro 价格、1M context、兼容接口。打开来源
[4] DeepSeek API Change Log:V2/V3/R1/V4 迭代时间线。打开来源
[5] DeepSeek V4 发布说明:V4-Pro/Flash、1M context、DSA、Agent 优化。打开来源
[6] DeepSeek Status:API/Web Chat uptime 和历史事件。打开来源
[7] DeepSeek Terms of Use:服务条款、司法辖区与生成式 AI 风险。打开来源
[8] DeepSeek Privacy Policy:数据收集、用户输入、文件、日志和隐私口径。打开来源
[9] DeepSeek Open Platform Terms:API Key、下游应用责任、输出权利。打开来源
[10] 幻方官网:AI 量化、萤火二号、3FS、调度和算力基础设施。打开来源
[11] DeepSeek-V2 arXiv:MLA、MoE、128K、成本和 KV Cache 指标。打开来源
[12] DeepSeek-V3 GitHub:671B/37B、14.8T tokens、FP8、MTP、MIT 许可。打开来源
[13] DeepSeek-V3 arXiv:V3 技术报告。打开来源
[14] DeepSeek-R1 GitHub:R1/R1-Zero、RL、蒸馏模型、开源。打开来源
[15] DeepSeek-R1 arXiv:推理能力、RL 路线和学术信息。打开来源
[16] 梁文锋采访汇编:资金来源、本土团队、组织文化和开源理念。打开来源
[17] BBC 中文梁文锋报道:幻方背景、本土团队、外部质疑。打开来源
[18] 新浪/36氪外部融资传闻:外部融资、估值、人才与适配传闻。打开来源
[19] 芯东西 V4 国产芯片适配:V4 与多家国产芯片适配报道。打开来源
[20] 财联社 V3.2-Exp 适配:国产芯片 Day-0 适配报道。打开来源
[21] CSO Online 攻击与宕机:网络攻击、注册限制和服务稳定风险。打开来源
置信度与数据限制
| 判断 | 置信度 | 说明 |
|---|---|---|
| DeepSeek 官方模型、API、条款、透明度中心 | 高 | 来自官方站、API 文档、模型卡、状态页和政策文件。 |
| V2/V3/R1 技术路线 | 高 | 来自论文、GitHub、Hugging Face 和官方技术报告。 |
| 幻方供血、组织文化、梁文锋采访 | 中高 | 多源一致,但部分为媒体采访和转载。 |
| 国产芯片适配、外部融资、监管风险 | 中 | 主要来自媒体、厂商公告或行业报道,需持续交叉验证。 |
| 长期基础设施化能力 | 中 | 属于产业判断,需要未来 SLA、企业客户、收入和合规数据验证。 |
数据限制:DeepSeek 未公开完整财务、客户结构、真实推理成本和训练总成本口径;部分外部融资、芯片适配和监管事件来自媒体报道,报告已按不确定性处理。
免责声明
本报告为公开信息研究与产业分析,不构成投资建议、采购建议或安全合规结论。企业使用 DeepSeek 或任何大模型服务前,应单独完成数据安全、隐私、合规、SLA、模型许可和本地部署评估。