曝Meta“偷師”千問，美國閉源巨頭蒸餾中國開源

2025-12-12 14:59

來源： OFweek人工智能網

外媒爆料，Meta 正在訓練的下一代旗艦模型 “Avocado” 直接調用阿里巴巴開源大模型通義千問系列進行蒸餾優化，訓練語料中已寫入千問 3 的推理輸出，用于提升代碼生成與多輪對話指標。

知情人士提供的內部會議紀要顯示，該做法在 11 月下旬即獲技術 VP 簽字，并上報 CEO 扎克伯格。

Meta 發言人今天回應媒體問詢時稱 “訓練工作按計劃推進”，未否認使用中國開源模型。

TBD Lab（To Be Determined Lab），是 Meta 內部的“超級智能特警隊”，

其成立機緣是 Meta 今年 4 月發布的 Llama 4 性能低于預期，公司在生成式 AI 市場份額跌至 11%，遠低于 OpenAI 的 43%，還被 DeepSeek 超越，導致 Meta 在開源模型領域的領導地位岌岌可危。

于是，扎克伯格以創始人模式親自上陣，重組 AI 戰略，意在通過開發下一代 Llama 4.5（也稱為 Llama 4.X）重奪技術制高點。

彭博社援引知情人士披露，Meta TBD Lab 內部評估認為，千問 3 在 STEM 推理與中文語義理解兩項基準上 “性價比最優”，故將其列入 Avocado 蒸餾隊列。

通義千問 3 于今年 8 月 18 日由阿里達摩院發布，采用 Apache 2.0 協議完全開源，上線 24 小時下載量突破 23 萬，目前版本迭代至 3.1。根據 GitHub 與 Hugging Face 公開數據，其參數規模 0.6 B—235 B 不等，HumanEval 評測得分 82.6，高于 Meta 同期 Llama 4 的 75.9。

Meta 內部備忘錄顯示，扎克伯格已批準將 2026 年資本開支上調至 700 億美元，三年累計投入預計 6000 億美元，用于追趕競爭對手。Avocado 被定為 “必須贏” 項目，計劃 2026 年一季度以閉源形式發布，屆時將停止對外完全開源權重。

在外媒曝光前，11 月 28 日，歐盟委員會依常規程序向 Meta 發出了監管問詢函，要求說明 Avocado 訓練數據來源，特別是涉及中國開源模型的 “跨境數據流動細節”。

如今 Meta 法務團隊正評估是否需在模型卡中標注 “包含 Qwen 系列蒸餾成分”。若最終落實，這將是美國巨頭首次在官方文檔中承認使用中國開源底座。

中國信通院今天發布的《全球人工智能開源生態白皮書》顯示，截至 2025 年 11 月，中國開源大模型貢獻量占全球 32%，千問、DeepSeek、ChatGLM 三大系列進入 GitHub 星標前二十。白皮書指出，中國開源模型已 “反向輸出” 至海外，成為美國頭部企業閉源系統的重要參考坐標。

截至發稿，阿里巴巴未就 “Meta 蒸餾千問” 作出評價，但通義千問 GitHub 倉庫 12 小時內新增星標 4200 個，其中 63% 來自北美與歐洲 ID。開發者留言中，“Avocado ingredient”成為最新熱詞。