DeepSeek组建Harness团队：中国AI从「秀参数」到「做产品」的关键一跳

大模型行业的战火，正在从"基座智商"烧向"终端入口"。

5月19日，DeepSeek 资深研究员陈德里在小红书上发了一条招聘贴，证实内部正在组建全新的"Harness"（代码智能体工程）团队，目标直指 Anthropic 旗下的明星产品 Claude Code。

这条消息的冲击力不在于"DeepSeek 要做编码工具了"，毕竟一家有模型的 AI 公司做编码工具再正常不过。真正值得注意的是：一家习惯于底层模型研究的公司，终于开始跨出实验室，亲自下场打造桌面端生产力入口。

招聘信息显示，DeepSeek 目前在北京海淀区开放了 Harness 产品经理与研发工程师两个岗位。新成员将全程参与"DeepSeek 桌面端 Agent 产品"研发全过程。招聘描述将核心路径定义为 Model + Harness = Agent。

与其说这是一次例行的团队扩张，不如说这是 DeepSeek 从"模型公司"向"产品公司"战略转向的第一个组织信号。

一、Model + Harness = Agent：工程哲学

很多外行人不理解，为什么 DeepSeek 已经有了这么聪明的模型，还要组建团队去做"Harness"。打个比方，DeepSeek 的模型就像一匹日行千里的"超级神马"。它力大无穷，什么路都能跑。但光有马不行，你得让它拉车。这个 Harness 团队，干的就是打制"马具"和"马车"的活。

以前 DeepSeek 只管养马，把马借给别人拉车。可别人做的马鞍可能磨腿，缰绳可能太松，马车轮子还总掉。结果就是：马虽好，车跑得磕磕绊绊，坐车的人还以为是马不行。

现在的 DeepSeek 反应过来了：要想车跑得又快又稳，就得自己打马具、造车。更关键的是，只有自己亲自赶车，才能感觉到哪段路有坑，哪种跑法马最省力。赶车人学到的每一条"路况经验"，都能回来喂给自家的马，让它下次跑得更聪明。

在技术层面，Harness 团队要做的事情可以拆解为五个核心模块：

上下文管理：让 Agent 理解长程对话和项目结构
工具调用：让 Agent 操作外部 API、数据库和文件系统
文件读写：让 Agent 处理实际项目文件
终端执行：让 Agent 执行命令并与系统交互
测试反馈闭环：让 Agent 从错误中学习、迭代改进

这五件事，正是 Claude Code 能够成为"最强编码 Agent"的核心能力。其在 SWE-bench Verified 取得的 87.60% 的惊人成绩，很大程度上得益于模型之外的工程能力，即上下文处理、工具编排与反馈闭环。

此前，DeepSeek 某位研究科学家在接受媒体采访时曾给出一个颇有预见性的判断：

「做 Agent 的公司一年后都会消失，因为肯定做不过我们。」

这句话背后的底层逻辑显而易见：DeepSeek 认为 Agent 赛道最终会收敛到拥有基础模型的公司手中，独立的 Agent 创业公司很难构筑起持久的壁垒。但收敛并不意味着"不做产品"——恰恰相反，既然 Agent 是模型的自然延伸，那最应该亲自下场做的，正是模型公司自己。

这种"模型公司亲做 Agent"的思路，刚好与 Anthropic 收购 Stainless 时的战略表述同频。Anthropic 在官方公告中明确提到："AI 前沿正在从'能回答的模型'转向'能行动的智能体'，而智能体的能力取决于它们能连接到什么。"两家科技巨头最终选择了同一条路：把 Harness 层的控制权从第三方工具手里收回来，变成模型能力的自然延伸。

二、从"秀参数"到"做产品"：中国AI的拐点信号

DeepSeek 此前最显著的身份标签是"开源模型公司"。从 V2 到如今的 V4 系列，它在 Hugging Face 上发布的开源模型一次次刷新了中国 AI 的技术天花板。但有一个事实常被忽略：在开发者生态中，DeepSeek 过去从未亲自做过面向开发者的桌面端生产力产品。

这与 DeepSeek 一贯的文化有关。梁文锋曾在多个场合表达过"专注基础研究"的定位。DeepSeek 的团队构成也印证了这一点：研究人员的比例远高于产品经理和工程师。但 Harness 团队的组建打破了这一定位。

更深层的信号在于时间节点。2026 年 5 月的这一周，AI 编码领域同时发生了三件大事：

Google I/O 发布 Antigravity 2.0，推出全新的独立桌面应用，把 AI 编码从 IDE 插件升级为多 Agent 编排平台
Anthropic 以 3 亿美元收购 Stainless，将 API 连接层直接纳入模型基础设施
DeepSeek 组建 Harness 团队，亲自下场做代码智能体产品

三件事发生在同一周绝非巧合。它们共同指向一个明确的方向：AI 竞赛的焦点，正在从"谁有更好的模型"转向"谁有更好的产品闭环"。

更深层的背景是，DeepSeek 正在推进其成立以来的首次外部融资。据公开信息显示，本轮募资总额直奔 500 亿元人民币（约 73.5 亿美元），有望创下中国 AI 企业最大单笔融资纪录。Harness 团队的组建，正是这笔天量资金在产品端的第一个落子。

模型能力会快速商品化，但产品体验、生态绑定、以及由开发者工具筑起的护城河只会持续加深。

Google 和 Anthropic 已经用行动验证了这一点，而 DeepSeek 的选择意味着，中国 AI 头部玩家也全面看清了牌局的下一幕。

三、代码智能体的四方格局

当前的 AI 编码工具市场已经形成了清晰的竞争格局：

选手	核心优势	SWE-bench	年化收入	路线
Anthropic Claude Code	编码智能+工程判断力	87.60%	~25亿美元	深度
OpenAI GPT-5	数亿用户基数+完整开发循环	—	—	广度
Cursor	极致用户体验	—	~20亿美元	体验
DeepSeek Harness	成本+开源+中文优化+数据飞轮	待发布	—	性价比

DeepSeek Harness 在这个牢固的格局里，至少能找到四个维度的差异化生存空间：

极致的成本优势：DeepSeek V4 系列的 API 定价远低于 Claude 和 GPT。如果 Harness 延续这一补贴策略，它将成为全球性价比最高的编码 Agent。
原生的开源生态：DeepSeek 模型在开源社区拥有极高的活跃度，此前开发者已自发推出了 DeepSeek-TUI 等项目。官方 Harness 能够完美收拢并互补这些自发力量。
中文编码的天然护城河：Claude Code 和 OpenAI 都是以英文场景为主进行优化的。面对中文技术栈中的 API 文档、特定社区生态，DeepSeek Harness 在国内市场拥有语言和文化上的绝对优势。
最关键的数据飞轮：Harness 团队的底牌不仅是"做一款产品"，更是通过真实项目中的代码测试、报错反馈，合规地反哺到底层模型的迭代闭环中。

四、Harness 背后的三层拐点信号

当然，DeepSeek Harness 目前还处于团队组建阶段，距离产品正式上线至少需要 6-12 个月的时间。这个时间差构成了巨大的不确定性：在这段窗口期里，Claude Code 的领先优势可能会进一步扩大。如果 Google 刚刚在 I/O 大会上发布的 Antigravity 2.0 也在同一时间抢占了更大的市场，DeepSeek 留下的入场空间将被进一步压缩。

对于仍在招兵买马的 Harness 来说，这注定是一场与时间的正面赛跑。

但抛开产品层面的不确定性，Harness 团队的组建本身释放了三层更深远的信号：

第一层——对 DeepSeek 自身：组织进化。从"开源模型实验室"到"产品公司"，这意味着团队结构、决策逻辑、人才画像的全面重塑。如果成功，DeepSeek 将拥有中国 AI 领域继阿里 Qwen Code 之后第二个原生代码 Agent 产品。

第二层——对中国 AI 产业：竞争升维。过去两年，中国 AI 公司的竞争焦点一直是"谁的模型参数更多、跑分更高"。但从 2026 年开始，竞争正在加速向"谁的产品更好用、谁的生态更完善"转移。这是一个典型的"窗口期博弈"：未来 12-18 个月，代码智能体市场将完成产品形态的初步固化。率先完成"模型→产品→数据"闭环的公司，将在下一个阶段获得结构性优势。

第三层——对开发者：更多选择、更低价格。当 DeepSeek 把"免费+开源+中文优化"的编码 Agent 推向市场时，Claude Code 和 OpenAI 编程版工作流的定价压力将显著增大。过去 AI 编码工具的价格已经呈现下降趋势，DeepSeek 的入局将加速这一进程。

总结

DeepSeek Harness 的组建，是中国 AI 的一道分水岭。分水岭的一边是"我有个好模型"，另一边是"我有一款好产品"。从这一刻起，中国 AI 公司不再只是秀参数的人，也要成为做产品的人。

DeepSeek 的入局时间不算早，但它带着模型能力的底牌和开源社区的口碑入场。这步棋的胜负，取决于 Harness 团队能否在窗口期内跑通从"开源模型"到"产品体验"的最后一公里。

企业级 Agent 不是一个模型问题，而是一个工程问题。谁能把模型能力和实际业务系统打通，谁就拥有真正的竞争力。