深度丨Anthropic和OpenAI把Harness帶出圈，AI管AI成為現(xiàn)實

2026-04-13 11:12

Ai芯天下

關(guān)注

前言：

從Prompt Engineering到Harness Engineering，AI行業(yè)正在完成一次關(guān)鍵的成年禮。

通過Harness，AI從一個需要人類時刻看管的工具，變成了一個可以自主完成復(fù)雜任務(wù)、自我管控、自我優(yōu)化的數(shù)字主體。

一個詞撬動一條賽道

2026年3月，AI行業(yè)里最熱的詞不是任何一個模型的名字，而是一個聽起來跟AI毫無關(guān)系的英文單詞：Harness。

它的本義是[馬具]，韁繩、籠頭、鞍具，那一整套套在馬身上的東西。

這個詞正在成為AI Agent時代最核心的產(chǎn)業(yè)概念，圍繞它正在生長出一個萬億美金規(guī)模的基礎(chǔ)設(shè)施層。

很多人將Harness理解為新的大模型或算法框架，但事實恰恰相反，Harness不觸碰大模型本身的參數(shù)與訓(xùn)練邏輯。

它是一套環(huán)繞在大模型周圍的完整控制與編排系統(tǒng)，是為AI智能體搭建的工程化[腳手架]與[安全帶]。

用更直白的話來說，Harness就是Agent的運行容器+安全邊界+調(diào)度控制器。

是包裹在Agent之外，讓它從一匹橫沖直撞的野馬，變成一匹能穩(wěn)定輸出的賽馬的全套馬具。

大模型就像是一個天賦極高但缺乏規(guī)則意識的天才實習(xí)生，他擁有極強的執(zhí)行能力，但很容易在復(fù)雜任務(wù)中偏離方向、擅自決策，甚至出現(xiàn)自己都無法察覺的錯誤。

而Harness就為這個實習(xí)生搭建的完整管理體系：明確的崗位職責、標準化的工作流程、獨立的驗收機制、持續(xù)的優(yōu)化閉環(huán)。

讓天才的能力被完整釋放，同時始終在可控的邊界內(nèi)運行。

它是一整套圍繞Agent運行的工程系統(tǒng)，包含三層結(jié)構(gòu)。

①Agent Harness（執(zhí)行層）：模型+工具調(diào)用+任務(wù)拆解，負責[做事]。

②Evaluation Harness（評估層）：自動測試、評分、結(jié)果比對，核心是[判斷做得對不對]。

③Control Harness（控制層）：權(quán)限控制、環(huán)境隔離、行為約束，決定[能不能做、做到什么程度]。

Anthropic官方給出了行業(yè)內(nèi)最具代表性的定義：Harness是支撐復(fù)雜AI智能體運行的外部框架、控制結(jié)構(gòu)與編排系統(tǒng)。

用于解決AI在完成復(fù)雜、長周期任務(wù)時的[失控]問題，通過外部控制機制彌補模型內(nèi)在的能力缺陷。

Anthropic的Harness實踐核心是經(jīng)典的三智能體分離架構(gòu)，將完整的復(fù)雜任務(wù)拆解給三個承擔不同職責的獨立AI智能體。

①規(guī)劃者（Planner）負責將用戶的簡單需求，擴展為完整的產(chǎn)品規(guī)格與執(zhí)行計劃，聚焦高層設(shè)計與任務(wù)邊界。

②生成者（Generator）負責按照拆分后的沖刺節(jié)點，逐個實現(xiàn)功能模塊，完成具體的執(zhí)行工作。

③評估者（Evaluator）則承擔獨立的驗收職責，像真實用戶一樣操作生成的內(nèi)容，對照提前約定的標準進行逐項測試與打分，不達標的內(nèi)容直接退回返工。

這套架構(gòu)最核心的創(chuàng)新，打破了[單一AI既當運動員又當裁判員]的死局。

將生成與評估的職責拆分給兩個獨立智能體之后，任務(wù)驗收的準確率直接提升到了94%，最終交付的成果質(zhì)量出現(xiàn)了量級式的跨越。

OpenAI的Harness實踐，則走了另一條以[可理解性]為核心的工程化路線。

其內(nèi)部團隊在5個月內(nèi)，通過Harness架構(gòu)實現(xiàn)了[零人工手動代碼]的突破。

讓AI智能體自主完成了一個超過百萬行代碼的內(nèi)部產(chǎn)品開發(fā)，平均每天完成3.5個生產(chǎn)級PR，全程僅由人類工程師進行方向把控。

Anthropic的三智能體對抗架構(gòu)和OpenAI的全流程工程化體系，它們的核心邏輯都高度一致。

不糾結(jié)于大模型本身的能力提升，而是通過外部的工程化框架，讓AI形成[規(guī)劃-執(zhí)行-評估-反饋-優(yōu)化]的完整閉環(huán)，用AI來管控、約束、優(yōu)化AI。

讓兩大死對頭形成默契的原因

AI對齊與安全是OpenAI與Anthropic從成立之初的核心命題，也是兩家公司所有技術(shù)路線的底層出發(fā)點。

但隨著模型能力的持續(xù)迭代，它們各自堅持的傳統(tǒng)解決方案，都已經(jīng)走到了瓶頸期。

OpenAI的核心對齊方案是行業(yè)通用的RLHF（人類反饋強化學(xué)習(xí)），通過人類標注員對AI的輸出進行打分排序，訓(xùn)練獎勵模型，讓AI學(xué)會生成符合人類價值觀的內(nèi)容。

但這套方案在模型能力持續(xù)提升的過程中，已經(jīng)出現(xiàn)了無法解決的根本性缺陷。

最核心的問題在于人類標注員的能力上限，已經(jīng)跟不上AI模型的能力進化速度。

就像一個小學(xué)生，根本沒有能力去評判一個博士生的畢業(yè)論文質(zhì)量。

這種[能力倒掛]，讓RLHF的效果出現(xiàn)了明顯的邊際遞減，甚至可能讓AI學(xué)到錯誤的對齊邏輯。

為了保證無害性，徹底犧牲了實用價值，這對于主打企業(yè)級服務(wù)的OpenAI來說，是無法接受的商業(yè)短板。

而Anthropic核心的憲法式AI（Constitutional AI）技術(shù)，用[AI反饋強化學(xué)習(xí)]替代了部分人類反饋，給AI一套明確的[憲法]原則，讓AI自己依據(jù)這套原則，進行自我批評、自我修正。

這套方案讓Anthropic在模型安全與對齊上，形成了自己的核心優(yōu)勢，但同樣沒能突破根本的瓶頸。

憲法式AI的核心局限在于它依然是[單一模型的自我監(jiān)督]，無法擺脫自我評價的天然偏差。

就像一個人很難客觀地看到自己的缺點，AI也同樣很難發(fā)現(xiàn)自己輸出內(nèi)容中的隱藏風險與邏輯漏洞。

同時，隨著模型承擔的任務(wù)越來越復(fù)雜，單一模型的自我管控很容易在多輪執(zhí)行中出現(xiàn)偏差累積，最終徹底偏離任務(wù)目標，也就是行業(yè)內(nèi)常說的[脫軌]。

OpenAI與Anthropic的企業(yè)客戶調(diào)研數(shù)據(jù)，都指向了同一個痛點：超過70%的企業(yè)客戶，在部署AI智能體時，最擔心的問題不是AI不夠聰明，而是AI會在執(zhí)行過程中做出無法預(yù)判的操作。

比如刪除重要文件、執(zhí)行惡意代碼、泄露敏感數(shù)據(jù)，或是在無人干預(yù)的情況下，擅自做出超出權(quán)限的決策。

而Harness架構(gòu)恰恰給這些所有的痛點，提供了一套完整的解決方案。

它跳出了[人類管AI]的傳統(tǒng)思路，轉(zhuǎn)向了[AI管AI]的全新范式。

在Harness的架構(gòu)中，人類不再需要事無巨細地監(jiān)督AI的每一步操作。

只需要設(shè)定好規(guī)則、邊界與目標，剩下的監(jiān)督、校驗、修正、優(yōu)化工作，都由不同職責的AI智能體相互配合完成。

AI的治理能力，終于可以和模型的執(zhí)行能力同步進化，不再受限于人類的能力上限。

同時，Harness通過嚴格的架構(gòu)約束、權(quán)限管控、沙箱運行機制，給AI的所有操作都加上了[安全帶]，解決了企業(yè)客戶最擔心的不可預(yù)測性問題。

AI的所有操作都在Harness設(shè)定的邊界內(nèi)運行，所有行為都有跡可循、可審計、可回溯，一旦出現(xiàn)違規(guī)操作，會立刻被評估智能體攔截并修正。

兩家在模型能力的競賽中打得不可開交，但在AI管控與治理這個核心命題上，遇到了同樣的瓶頸，也找到了同樣的解決方案。

兩家頭部企業(yè)的集體站臺，讓行業(yè)終于看清了Harness的核心價值。

集體擁抱Harness背后的產(chǎn)業(yè)邏輯

過去三年，從參數(shù)規(guī)模的比拼，到推理能力的迭代，從多模態(tài)能力的升級，到上下文窗口的拉長，所有人都在追求[更聰明的大模型]。

但到了2026年，行業(yè)的共識已經(jīng)發(fā)生了根本性的變化：主流大模型的復(fù)雜推理能力差距正在逐步縮小，國內(nèi)開源模型和海外閉源模型的能力鴻溝，也在快速填平。

騰訊集團高級執(zhí)行副總裁湯道生，在今年騰訊云峰會上明確提出了這個判斷：[AI落地不只是一道算法題，更是一道工程題。在同樣的模型能力下，不同的Harness設(shè)計，都將影響AI落地的實際效果。]

這句話道破了當下AI行業(yè)的核心命題，當模型能力不再是稀缺資源，工程化能力，就成了企業(yè)AI落地的核心競爭力。

而Harness正是這套工程化能力的核心載體，其價值已經(jīng)得到了實打?qū)嵉墓こ舔炞C。

LangChain的Deep Agents團隊，在固定使用GPT-5.2-Codex模型的前提下，通過優(yōu)化Harness設(shè)計，就把coding agent在Terminal Bench 2.0上的得分，從52.8%提升到了66.5%，排名從行業(yè)Top30附近，直接躍升至Top5。

這意味著，Harness Engineering把過去[調(diào)試模型]的工作，轉(zhuǎn)化成了[調(diào)整系統(tǒng)]的工作。

不需要改動模型的架構(gòu)和參數(shù)，就能持續(xù)放大模型已有的能力，這對于絕大多數(shù)企業(yè)來說，無疑是一條性價比更高、落地性更強的AI落地路徑。

這也是為什么，國內(nèi)的頭部廠商，都已經(jīng)把Harness Engineering，當成了自己AI戰(zhàn)略的核心抓手。

火山引擎總裁譚待則表示，字節(jié)推出的[字節(jié)版龍蝦]Arkclaw，已經(jīng)全面應(yīng)用了Harness架構(gòu)，核心思路就是把最好的框架進行服務(wù)化和產(chǎn)品化，讓框架和模型協(xié)同進化。

結(jié)尾：

很多人把Harness窄化為一種AI工程落地的技巧，但它真正代表的，是AI世界正在建立一套全新的秩序。

AI從單點能力進化為完整的工程系統(tǒng)，真正實現(xiàn)了全生命周期的可管理、可治理。

它不是單模型無限迭代的、更強的算力時代，而是多智能體協(xié)同可控的、更穩(wěn)定的系統(tǒng)時代。

部分資料參考：APPSO：《Token 剛定了中文名，AI 圈又多了個翻譯不了的詞》，字母榜：《一曲新詞酒一杯，喝到Harness我就醉》，機器之心：《Context還不夠，Harness才是Agent工程優(yōu)化的正解？》，騰訊研究院：《騰訊湯道生：AI落地不只是算法題，Harness工程能力是關(guān)鍵變量》

原文標題 : 深度丨Anthropic和OpenAI把Harness帶出圈，AI管AI成為現(xiàn)實