DeepSeek / 幻方量化独立深度调研：效率型开源模型组织如何走向 AI 基础设施

元数据：调研模式 deep-redo · 数据截至 2026-06-08 · 重做时间 2026-06-08 20:50:00 · 本版按独立专题重构，不沿用上一版横向对比模板。

参考来源：DeepSeek 官方、API 文档、透明度中心、幻方官网、V2/V3/R1 论文与 GitHub、梁文锋采访、合规条款和媒体报道等 · 共引用 21 个来源

核心判断：DeepSeek 的独特性不是单次模型领先或低价 API，而是幻方量化供血、本土研究组织、开源效率路线和工程成本优势共同形成的复合系统；它已经证明效率可以改变全球模型价格和技术叙事，下一步必须证明自己能成为可靠、合规、可持续的 AI 基础设施。

一、总判断：DeepSeek 的特殊性不是低价，而是“研究组织 + 工程效率 + 开源扩散”的组合

核心判断：DeepSeek 不是典型 VC 驱动的大模型公司，也不是单纯 API 服务商，而是由幻方量化长期 AI 基础设施和现金流支撑的基础模型研究组织。

DeepSeek 最容易被外界记住的是低价、开源和 R1 爆发，但如果只从产品层看，会错过它真正的特殊性。DeepSeek 的底层结构是：幻方量化长期建设 AI 算力和工程系统，梁文锋以量化基金现金流和研究预算支持基础模型研发，团队以本土年轻研究员为主，技术路线围绕稀疏化、低成本训练、推理效率、开源扩散和 API 普惠展开。[10][16][17]

这使 DeepSeek 和普通创业公司不同。许多 AI 公司先融资，再买算力，再找商业化；DeepSeek 更像先有一个 AI 量化基础设施和现金流母体，再孵化基础模型研究。幻方官网披露的萤火二号、任务级分时调度、3FS、算子库和集群使用率，说明它在 DeepSeek 出圈前就有长期 AI 工程积累。[10]

DeepSeek 的技术路线也不是“参数越大越好”。V2 用 MLA 和 DeepSeekMoE 降低 KV Cache 和推理成本；V3 用 671B 总参数、37B 激活、FP8、MoE、MTP 和 2.788M H800 GPU hours 建立效率叙事；R1 通过 RL 把开源推理模型推向全球认知；V4 又把百万上下文、Agent、低价 API 和国产芯片适配推向基础设施阶段。[3][5][11][12][14]

本报告的核心判断是：DeepSeek 的护城河不是闭源模型，也不是一次跑分领先，而是组织、算力、工程效率、开源生态和低价 API 共同形成的复合系统。它已经证明中国团队可以用效率路线改变全球模型价格和技术叙事；但它还需要证明自己能从研究组织升级为可信赖的全球 AI 基础设施公司。

二、幻方供血：DeepSeek 的起点不是融资，而是量化基金的 AI 基础设施

核心判断：幻方量化给 DeepSeek 提供的不只是钱，而是算力、工程文化和“用 AI 解决复杂问题”的组织前史。

幻方官网把自己定义为“使用 AI 进行投资的对冲基金”和“AI 基础科学研究”组织，披露了萤火二号训练平台、3FS 文件系统、任务级分时调度、hfai.nn、hfreduce 等基础设施。[10] 这些内容说明，DeepSeek 不是从零开始搭建 AI 工程能力，而是继承了量化交易时代对算力、分布式系统、调度和高性能计算的长期投入。

量化基金供血有两个重要后果。第一，DeepSeek 早期可以不完全受 VC 融资节奏约束。梁文锋在采访中提到，资金来自幻方研发预算，不急于应用商业化，目标指向 AGI 和基础模型。[16] 这种结构让团队可以把资源投入模型效率、训练系统和研究问题，而不是过早围绕收入 KPI 设计产品。

第二，量化背景塑造了 DeepSeek 的工程偏好。量化交易天然重视效率、吞吐、成本、自动化和系统稳定，这些偏好迁移到模型研发，就表现为 MLA、MoE、FP8、缓存、低价 API 和开源推理优化。DeepSeek 的效率路线不是营销口号，而有组织土壤。

但幻方供血也有风险。DeepSeek 的独立性和长期预算，某种程度上依赖幻方业务稳定。如果量化收益下降、监管环境变化或资源投入优先级改变，DeepSeek 的研究节奏可能受影响。外部融资传闻出现，也说明单靠母公司供血可能已经不能完全覆盖下一阶段算力、人才和基础设施化需求。[18]

三、梁文锋方法论：低价、开源和本土团队不是偶然选择

核心判断：DeepSeek 的产品策略与梁文锋公开表达高度一致：重研究、重效率、低价普惠、开放扩散、本土团队。

梁文锋采访中有几个高频信号：资金来自幻方研发预算；API 不贴钱也不暴利；V2 团队没有海外回来的人，都是本土人才；组织自下而上，调用卡和人不设上限；目标是 AGI，而不是先做应用商业化。[16][17] 这些信息解释了 DeepSeek 为什么会选择低价和开源。

低价不是单纯补贴，而是技术路线的外显。如果模型结构和推理系统能显著降低成本，那么低价 API 就不只是市场策略，而是把效率优势转化为用户可感知价值。DeepSeek V2 之后国内模型价格战被重新定价，说明它确实改变了行业价格锚。[11]

开源也不是单纯获取声量。对 DeepSeek 来说，开源带来三种收益：第一，吸引全球开发者和研究者验证模型；第二，推动云厂商、推理框架和国产芯片适配；第三，扩大 DeepSeek 作为基础模型的事实标准影响力。R1 开源后引发全球关注，说明这个策略有效。[14][15]

本土年轻团队则让 DeepSeek 形成独特文化。相对成熟大厂，年轻团队路径依赖更少，愿意重写训练系统和尝试非主流优化；相对海外团队，本土团队更适合在国内算力、国产芯片和政策环境下做工程适配。但这也带来组织风险：人才容易被挖，管理经验不足，基础设施化后需要更多安全、法务、客服和企业支持能力。

四、V2 到 V4：DeepSeek 的主线是效率不断变成战略武器

核心判断：DeepSeek 的模型路线不是线性堆参数，而是一次次把工程效率转化为市场影响。

V2 是战略转折点。论文显示，DeepSeek-V2 使用 MLA 和 DeepSeekMoE，236B 总参数、21B 激活、128K 上下文，相比 DeepSeek 67B 节省 42.5% 训练成本，KV Cache 降低 93.3%，最大生成吞吐提升 5.76 倍。[11] 这些数字解释了为什么 DeepSeek 能发起价格冲击：不是简单赔本卖，而是结构上更便宜。

V3 把效率叙事推到更大规模。GitHub 和论文显示，V3 采用 671B 总参数、37B 激活、14.8T tokens、2.788M H800 GPU hours，并使用 MLA、DeepSeekMoE、辅助损失无关负载均衡、MTP、FP8 混合精度等技术。[12][13] V3 的意义在于证明较低训练成本也能做出强模型，从而冲击“只有巨额算力投入才能领先”的行业叙事。

R1 是认知转折点。R1/R1-Zero 使用大规模强化学习，强调推理能力可以通过可验证奖励学习出来，而不完全依赖人工标注推理轨迹。[14][15] 这让 DeepSeek 从“便宜好用的中国模型”变成全球推理模型讨论里的核心变量。开源 R1 和蒸馏模型进一步扩大了影响。

V4 则进入基础设施阶段。官方发布说明称 V4 Preview 包含 V4-Pro 和 V4-Flash，支持 1M 上下文、DSA 稀疏注意力、Agent 能力优化、OpenAI/Anthropic API 支持，并给出极低 API 价格。[3][5] 这说明 DeepSeek 已经不只是发布模型，而是在搭建长上下文、低价、Agent 和兼容生态的服务平台。

五、低价 API：DeepSeek 改变的是行业价格锚，不只是收费表

核心判断：DeepSeek 的低价 API 是效率路线的市场化表达，也可能成为基础设施化的压力源。

DeepSeek API 价格页显示，V4-Flash 和 V4-Pro 均支持 1M 上下文、384K 最大输出，并兼容 OpenAI/Anthropic 接口。V4-Flash cache hit 价格低至每百万 tokens 0.0028 美元，cache miss 0.14 美元，output 0.28 美元；V4-Pro 也维持较低价格。[3] 这种价格结构把 context caching 的价值直接传导给开发者。

低价有战略意义。第一，它扩大模型使用量，让 DeepSeek 成为开发者默认测试对象。第二，它迫使同行降价，重置国内外模型服务价格锚。第三，它让企业和个人更容易把大模型嵌入产品。第四，它配合开源形成双重扩散：能本地部署的人用权重，想省事的人用 API。

但低价也是压力源。基础设施公司不能只追求便宜，还要提供稳定 SLA、客服、安全、合规、账单、速率限制、故障恢复和企业支持。DeepSeek 状态页显示 API 可用性较高，但 Web Chat 可用性低于 API，历史上也有攻击、注册限制和长时间 outage 报道。[6][18] 如果企业把 DeepSeek 当关键服务，低价之外必须有可靠性。

因此，DeepSeek 的下一阶段不是继续降价，而是证明“低价也可靠”。如果能做到，它会成为全球 AI 基础设施的重要一极；如果低价伴随不稳定和支持不足，企业客户会把它视为实验或备选，而非主路径。

六、开源效率：DeepSeek 把影响力交给社区，也把护城河变薄

核心判断：开源让 DeepSeek 快速扩散，也迫使它不能靠封闭模型建立传统护城河。

DeepSeek 的开源策略非常激进。V3、R1 等模型通过 GitHub、Hugging Face、论文和模型卡公开，代码和模型许可支持商用或较宽松使用。[12][14] 这让全球开发者、云厂商、推理框架、国产芯片厂商和研究者都能快速接入。

开源带来的第一层价值是验证。模型能力不再只靠官方榜单，而是由社区复现、部署、蒸馏和二次开发验证。第二层价值是适配。各种推理框架、芯片、云服务和应用可以围绕 DeepSeek 做优化。第三层价值是声誉。R1 的开源扩散让 DeepSeek 成为全球 AI 讨论中心。

但开源也削弱传统商业壁垒。别人可以下载权重、蒸馏模型、部署私有版本，企业也可能只用 DeepSeek 的开源成果而不付 API 费用。DeepSeek 必须用更快迭代、更低成本、更好服务、更强工具和生态兼容性维持优势。

换句话说，DeepSeek 的护城河不是“别人拿不到模型”，而是“别人即使拿到模型，也难以复制它持续产出低成本强模型的组织系统”。这让 DeepSeek 更像 Linux/PyTorch 式基础生态，而不是传统 SaaS 公司。

七、国产芯片适配：DeepSeek 可能成为中国 AI 软硬协同的标杆负载

核心判断：DeepSeek 对国产芯片生态的价值，可能大于单个应用市场价值。

DeepSeek 模型开源和低价 API 的外部性之一，是推动国产芯片适配。V3、R1 到 V4 相关报道显示，华为昇腾、寒武纪、海光、摩尔线程、沐曦、昆仑芯等厂商都在围绕 DeepSeek 模型进行适配。[19][20] 这些信息部分来自媒体和厂商公开动作，需要继续交叉验证，但趋势非常明确：DeepSeek 已成为国产 AI 芯片生态的重要工作负载。

这件事的意义不只是“能在国产卡上跑”。真正重要的是：DeepSeek 的 MoE、稀疏注意力、长上下文、低精度推理和大规模并发，正好覆盖国产 AI 芯片最需要证明的能力。厂商如果能把 DeepSeek 跑好，就能向市场证明自己的推理框架、算子、显存管理、通信和稳定性。

对 DeepSeek 来说，国产芯片适配也是战略安全垫。面对英伟达芯片限制和全球供应链不确定性，能在多种国产硬件上部署，意味着更强的供应弹性和国内企业采用便利。对中国 AI 产业来说，DeepSeek 可能成为类似“事实标准模型负载”的角色。

但适配不能只看 Day-0 宣传。企业真正关心的是吞吐、延迟、成本、稳定性、工具链、调试体验、生态成熟度和长期维护。国产芯片能不能承接 DeepSeek 的基础设施化需求，还需要更多生产环境数据。

八、透明度与合规：DeepSeek 已有框架，但离企业级信任仍有距离

核心判断：DeepSeek 在模型透明度上进步明显，但企业级合规、隐私和服务承诺仍需加强。

DeepSeek 官方站已提供透明度中心、模型卡、技术报告、API 文档、服务状态、隐私政策、用户协议和开放平台条款。[1][2][7][8][9] 这比许多只给模型入口的公司更完整。透明度中心列出主要模型、发布时间和技术报告；状态页披露 API 与 Web Chat uptime；条款说明数据、服务、责任和下游开发者义务。

隐私政策显示，DeepSeek 可能收集账号信息、用户输入、上传文件、聊天历史、设备/网络、日志和 IP 近似位置等。[8] 对个人用户这属于常见 AI 服务口径；对企业、政府、金融、医疗和跨境业务，则必须做更严格评估。开放平台条款也明确，下游应用需要自行履行个人信息告知、同意、权利响应和安全措施。[9]

服务条款还说明，DeepSeek 可变更、暂停或终止服务，不保证所有司法辖区可用。[7] 这对开发者和企业很重要：如果把 DeepSeek API 接入关键业务，就必须考虑备份模型、SLA、合规审计和故障切换。

因此，DeepSeek 的透明度是“研究与开发者级别逐步完善”，还不是“全球企业基础设施级别完全成熟”。下一步需要更清楚的数据处理选项、企业 SLA、私有化/专有部署条款、安全认证、区域合规和客户支持体系。

九、外部融资传闻：研究组织是否进入公司化拐点

核心判断：如果外部融资落地，DeepSeek 的叙事会从“幻方供血的研究组织”转向“资本参与的基础设施公司”。

外部融资传闻称 DeepSeek 可能寻求首次外部融资，目标估值不低于 100 亿美元、融资至少 3 亿美元。[18] 该信息未获 DeepSeek 官方确认，必须谨慎处理。但无论传闻是否落地，它都揭示一个现实：DeepSeek 下一阶段可能需要更多资金、治理和商业化能力。

融资动因并不难理解。V4/V5 继续训练需要算力，国产芯片适配需要工程投入，全球 API 需要服务基础设施，企业客户需要支持团队，安全合规需要法务和审计，核心人才也需要长期激励。幻方供血模式虽然独特，但基础设施化阶段的资金和组织要求可能远超研究阶段。

融资的好处是增强资源。外部资本可以帮助 DeepSeek 建立全球服务、企业销售、合规体系和人才激励。坏处是引入退出压力和商业 KPI。梁文锋公开表达中强调长期研究和自下而上文化，外部股东可能改变这种节奏。[16]

因此，融资若发生，不应简单解读为利好或利空。它代表 DeepSeek 从研究组织走向基础设施公司的拐点。关键看资本是否尊重其研究文化，是否帮助补齐公司能力，而不是迫使它过早追求短期营收。

十、结论：DeepSeek 的下一题不是模型发布，而是可信基础设施

核心判断：DeepSeek 已经证明效率和开源可以改变行业，下一步要证明可靠性、合规和组织规模化。

重做后，DeepSeek 的独特性应该从“便宜模型”提升为“效率型基础模型组织”。它的核心资产是幻方供血、梁文锋方法论、本土研究团队、工程效率、开源扩散、低价 API 和国产芯片适配。V2、V3、R1、V4 不是孤立模型，而是一条效率不断外显为战略影响的路线。

DeepSeek 已经改变三件事：第一，它让全球重新评估中国模型的技术上限；第二，它把开源推理模型推到前沿讨论；第三，它把 API 价格和国产软硬协同推入新阶段。

但它还要证明三件事：第一，低价 API 能否长期稳定；第二，开源生态能否反哺收入和企业信任；第三，研究组织能否补齐安全、合规、SLA、客户支持和全球服务能力。DeepSeek 的未来不取决于下一次发布是否再度震撼，而取决于它能否让企业和开发者放心把关键工作负载交给它。

十一、V2/V3/R1/V4 的连续性：DeepSeek 不是突然爆红，而是效率路线逐层外显

核心判断：DeepSeek 的每一代关键模型都在回答同一个问题：如何用更低成本实现更强能力，并把效率转化为生态影响。

V2 回答的是“推理成本能不能大幅下降”。MLA 降低 KV Cache，MoE 降低激活参数，吞吐提升让低价 API 具备技术基础。[11] 这一步让 DeepSeek 从研究项目变成行业价格变量。

V3 回答的是“低成本能不能做大规模强模型”。671B 总参数、37B 激活、FP8、MTP、2.788M H800 GPU hours，这些信息共同构成 DeepSeek 的工程效率叙事。[12][13] 它挑战了行业对训练成本的直觉：不是只有最大预算才能做出前沿模型。

R1 回答的是“开源推理模型能不能进入全球前沿讨论”。R1-Zero 与 R1 的 RL 路线、冷启动和蒸馏模型，让 DeepSeek 从国内价格战走向全球认知战。[14][15] R1 最重要的影响不是某个榜单，而是让大量研究者和开发者重新思考推理能力的训练路径。

V4 回答的是“DeepSeek 能不能成为基础设施”。1M 上下文、DSA、Agent 能力、V4-Pro/V4-Flash、OpenAI/Anthropic 兼容接口和低价 API，都是基础设施公司需要的能力组合。[3][5] 这条线索说明，DeepSeek 的技术迭代不是孤立爆点，而是持续把效率扩散到模型、API、开源和硬件生态。

十二、企业采用 DeepSeek 的真实顾虑：强模型之外还有五道门槛

核心判断：企业不会只因为模型强或便宜就把关键业务交给 DeepSeek，还要看安全、合规、SLA、支持和可控部署。

第一道门槛是数据。DeepSeek 隐私政策显示服务会处理用户输入、上传文件、聊天历史、设备信息和日志等。[8] 企业若输入合同、代码、客户数据或业务文档，必须明确数据是否训练、存储多久、在哪个司法辖区、如何删除、是否支持私有化或企业隔离。

第二道门槛是 SLA。低价 API 很吸引人，但企业关键业务需要稳定性、错误率、延迟、配额、故障通知和赔付机制。状态页是进步，但与成熟云服务 SLA 仍有差距。[6]

第三道门槛是合规。金融、医疗、政务、教育、跨境企业使用 AI 服务，需要内容安全、隐私、审计、访问控制、日志留存和模型输出责任。DeepSeek 的条款把部分下游责任交给开发者，这对平台合理，但企业仍需独立评估。[7][9]

第四道门槛是支持。开源社区可以解决很多技术问题，但企业客户需要工单、客户成功、架构支持、迁移方案和事故响应。DeepSeek 若要基础设施化，必须从研究团队扩展出服务组织。

第五道门槛是可替代性。开源降低了采用门槛，也降低了 API 锁定。企业可能本地部署 DeepSeek 权重，也可能在云厂商上调用蒸馏版本。DeepSeek 要获得收入，需要证明官方 API 或官方服务比第三方部署更稳、更快、更安全。

十三、国产芯片适配的深层意义：DeepSeek 正成为算力生态的共同语言

核心判断：DeepSeek 的开源模型给国产芯片厂商提供了统一试金石，也让模型公司和硬件公司形成相互验证。

国产芯片最缺的不是单次 demo，而是稳定、复杂、真实、有开发者需求的工作负载。DeepSeek 正好提供这种负载：MoE、长上下文、推理优化、低价大流量、R1 推理、V4 Agent 和百万上下文。厂商若能让 DeepSeek 跑得好，就能证明自己的编译器、算子、通信、显存和框架成熟度。[19][20]

这对中国 AI 生态有放大效应。过去国产芯片常被 CUDA 生态压制，缺少统一应用牵引。DeepSeek 开源后，芯片厂商、云厂商、框架团队和企业客户都围绕同一个模型做适配，生态协同效率会提高。DeepSeek 不一定直接从每次适配中赚钱，但它会成为软硬件协同的中心节点。

风险在于，适配宣传容易高于真实生产效果。Day-0 能跑不代表成本、延迟和稳定性优于成熟 GPU；BF16 转换、FP8/FP4 支持、稀疏 Attention、MoE 通信都会影响最终效率。DeepSeek 若要深度绑定国产芯片，需要公开更多 benchmark、最佳实践和企业案例，否则适配价值会停留在公关层。

十四、DeepSeek 的组织转型：研究文化如何不被基础设施化吞掉

核心判断：DeepSeek 最大的中长期难题，是在保持研究速度的同时建立企业级组织能力。

研究组织追求探索、速度、低层级和高自由度。基础设施公司追求稳定、流程、合规、安全和客户承诺。DeepSeek 现在正站在两者之间。它的成功来自前者，但未来收入和企业采用需要后者。

如果 DeepSeek 过度公司化，可能削弱自下而上的研究文化，降低探索效率。若继续保持纯研究组织，又难以支撑全球 API、企业客户、合规审计、服务稳定和安全响应。外部融资传闻之所以重要，不只是钱的问题，而是组织形态的问题。[18]

最理想的路径，是把研究核心和基础设施团队分层：研究团队继续保持高自由度，平台团队负责 API、SLA、安全、文档、客户支持和企业交付。开源社区继续扩大外部适配，官方服务负责可靠性和合规。只有这样，DeepSeek 才能避免在商业化中失去研究优势。

DeepSeek 的最终考验，不是下一代模型是否再度惊艳，而是它能不能长期把惊艳模型变成可信服务。研究能力让它赢得注意力，基础设施能力才会让它赢得企业预算。

十五、DeepSeek 的深水区：开源之后，官方服务还凭什么收费

核心判断：DeepSeek 越开源，越要回答官方 API 和官方平台的不可替代性；否则影响力很大，但收入未必归自己。

DeepSeek 的开源策略带来了巨大影响力，但也制造了商业化悖论。模型权重开放以后，云厂商、推理平台、企业私有化团队和开发者都可以部署 DeepSeek 或其蒸馏版本。[12][14] 这会让 DeepSeek 的生态扩散非常快，却不必然让收入回到 DeepSeek 官方账户。开源模型的商业化问题，正在于“使用越广泛，价值捕获越难”。

官方 API 要收费，必须提供第三方部署难以替代的东西。第一是最新模型优先使用。若 V4、V5 或更强版本总是官方 API 最先稳定上线，开发者会愿意付费。第二是更低总成本。官方若有更好的缓存、批处理、调度和硬件优化，就能比自建更便宜。第三是更稳定服务。企业不愿自己运维大模型时，会为 SLA 和故障支持付费。第四是合规和安全。若官方能提供企业隔离、审计、数据处理选项和私有部署，收入空间会更大。

DeepSeek 当前已经具备一部分条件：API 低价、OpenAI/Anthropic 兼容、状态页、透明度中心和开放平台条款。[2][3][6][9] 但这些还只是基础。要成为真正基础设施公司，它还需要更强的企业服务层：专属实例、区域部署、数据不留存选项、SLA、账单管理、团队权限、监控、技术支持和安全认证。

如果 DeepSeek 不能补齐官方服务价值，它可能成为“全球最有影响力的开源模型之一”，但商业收入被云厂商和第三方平台分走。反过来，如果它能让官方 API 成为最便宜、最新、最稳、最合规的 DeepSeek 使用方式，开源就不是收入损失，而是获客和生态扩散。DeepSeek 的商业命题正在这里：用开源赢世界，用官方服务收回价值。

十六、国际信任问题：DeepSeek 越像基础设施，越会被用安全标准审视

核心判断：DeepSeek 的全球影响力越大，围绕数据、审查、供应链和公共部门使用的争议就越难回避。

R1 之后，DeepSeek 不再只是中国开发者使用的模型，而成为全球用户、企业和政府都关注的基础模型。影响力提升后，评价标准会变化。普通用户关心好不好用、便不便宜；企业关心数据和 SLA；政府部门关心供应链、数据主权、内容安全和地缘政治风险。DeepSeek 的隐私政策、服务条款和透明度中心已经给出基础框架，但还不足以消除国际市场疑虑。[2][7][8]

国际信任的核心不只是“数据是否安全”，而是“能否被审计”。企业和公共部门会问：输入数据是否用于训练？日志保存多久？是否支持区域化部署？是否能提供模型版本锁定？是否有内容过滤说明？发生安全事件如何通知？是否有第三方安全认证？这些问题如果没有标准答案，DeepSeek 即使模型便宜，也难以进入高敏感行业主路径。

这也是开源的双重作用。开源提升透明度，让外界可以检查模型和部署；但官方云服务仍然涉及数据处理、接口可用性和运营主体。许多海外客户可能愿意本地部署 DeepSeek 权重，却不愿直接使用官方 API；这会扩大生态影响力，但削弱官方收入捕获。

因此，DeepSeek 的全球化不是简单拓展市场，而是建立信任基础设施。它需要在模型透明度之外，补齐安全白皮书、企业隐私选项、私有化部署、审计日志、服务等级、地区合规和事件响应。只有这样，它才能从“全球开发者喜欢的开源模型”升级为“全球企业敢用的基础设施”。

参考来源

[1] DeepSeek 官网：公司主体、产品入口、V4 预览、API 与透明度入口。打开来源

[2] DeepSeek 透明度中心：模型发布时间、模型卡和技术报告。打开来源

[3] DeepSeek API 价格页：V4-Flash/V4-Pro 价格、1M context、兼容接口。打开来源

[4] DeepSeek API Change Log：V2/V3/R1/V4 迭代时间线。打开来源

[5] DeepSeek V4 发布说明：V4-Pro/Flash、1M context、DSA、Agent 优化。打开来源

[6] DeepSeek Status：API/Web Chat uptime 和历史事件。打开来源

[7] DeepSeek Terms of Use：服务条款、司法辖区与生成式 AI 风险。打开来源

[8] DeepSeek Privacy Policy：数据收集、用户输入、文件、日志和隐私口径。打开来源

[9] DeepSeek Open Platform Terms：API Key、下游应用责任、输出权利。打开来源

[10] 幻方官网：AI 量化、萤火二号、3FS、调度和算力基础设施。打开来源

[11] DeepSeek-V2 arXiv：MLA、MoE、128K、成本和 KV Cache 指标。打开来源

[12] DeepSeek-V3 GitHub：671B/37B、14.8T tokens、FP8、MTP、MIT 许可。打开来源

[13] DeepSeek-V3 arXiv：V3 技术报告。打开来源

[14] DeepSeek-R1 GitHub：R1/R1-Zero、RL、蒸馏模型、开源。打开来源

[15] DeepSeek-R1 arXiv：推理能力、RL 路线和学术信息。打开来源

[16] 梁文锋采访汇编：资金来源、本土团队、组织文化和开源理念。打开来源

[17] BBC 中文梁文锋报道：幻方背景、本土团队、外部质疑。打开来源

[18] 新浪/36氪外部融资传闻：外部融资、估值、人才与适配传闻。打开来源

[19] 芯东西 V4 国产芯片适配：V4 与多家国产芯片适配报道。打开来源

[20] 财联社 V3.2-Exp 适配：国产芯片 Day-0 适配报道。打开来源

[21] CSO Online 攻击与宕机：网络攻击、注册限制和服务稳定风险。打开来源

置信度与数据限制

判断	置信度	说明
DeepSeek 官方模型、API、条款、透明度中心	高	来自官方站、API 文档、模型卡、状态页和政策文件。
V2/V3/R1 技术路线	高	来自论文、GitHub、Hugging Face 和官方技术报告。
幻方供血、组织文化、梁文锋采访	中高	多源一致，但部分为媒体采访和转载。
国产芯片适配、外部融资、监管风险	中	主要来自媒体、厂商公告或行业报道，需持续交叉验证。
长期基础设施化能力	中	属于产业判断，需要未来 SLA、企业客户、收入和合规数据验证。

数据限制：DeepSeek 未公开完整财务、客户结构、真实推理成本和训练总成本口径；部分外部融资、芯片适配和监管事件来自媒体报道，报告已按不确定性处理。

免责声明

本报告为公开信息研究与产业分析，不构成投资建议、采购建议或安全合规结论。企业使用 DeepSeek 或任何大模型服务前，应单独完成数据安全、隐私、合规、SLA、模型许可和本地部署评估。