外媒爆料,Meta 正在訓練的下一代旗艦模型 “Avocado” 直接調用阿里巴巴開源大模型通義千問系列進行蒸餾優化,訓練語料中已寫入千問 3 的推理輸出,用于提升代碼生成與多輪對話指標。
知情人士提供的內部會議紀要顯示,該做法在 11 月下旬即獲技術 VP 簽字,并上報 CEO 扎克伯格。
Meta 發言人今天回應媒體問詢時稱 “訓練工作按計劃推進”,未否認使用中國開源模型。
TBD Lab(To Be Determined Lab), 是 Meta 內部的“超級智能特警隊”,
其成立機緣是 Meta 今年 4 月發布的 Llama 4 性能低于預期,公司在生成式 AI 市場份額跌至 11%,遠低于 OpenAI 的 43%,還被 DeepSeek 超越, 導致 Meta 在開源模型領域的領導地位岌岌可危。
于是,扎克伯格以創始人模式親自上陣,重組 AI 戰略,意在通過開發下一代 Llama 4.5(也稱為 Llama 4.X)重奪技術制高點。
彭博社援引知情人士披露,Meta TBD Lab 內部評估認為,千問 3 在 STEM 推理與中文語義理解兩項基準上 “性價比最優”,故將其列入 Avocado 蒸餾隊列。
通義千問 3 于今年 8 月 18 日由阿里達摩院發布,采用 Apache 2.0 協議完全開源,上線 24 小時下載量突破 23 萬,目前版本迭代至 3.1。根據 GitHub 與 Hugging Face 公開數據,其參數規模 0.6 B—235 B 不等,HumanEval 評測得分 82.6,高于 Meta 同期 Llama 4 的 75.9。
Meta 內部備忘錄顯示,扎克伯格已批準將 2026 年資本開支上調至 700 億美元,三年累計投入預計 6000 億美元,用于追趕競爭對手。Avocado 被定為 “必須贏” 項目,計劃 2026 年一季度以閉源形式發布,屆時將停止對外完全開源權重。
在外媒曝光前,11 月 28 日,歐盟委員會依常規程序向 Meta 發出了監管問詢函,要求說明 Avocado 訓練數據來源,特別是涉及中國開源模型的 “跨境數據流動細節”。
如今 Meta 法務團隊正評估是否需在模型卡中標注 “包含 Qwen 系列蒸餾成分”。若最終落實,這將是美國巨頭首次在官方文檔中承認使用中國開源底座。
中國信通院今天發布的《全球人工智能開源生態白皮書》顯示,截至 2025 年 11 月,中國開源大模型貢獻量占全球 32%,千問、DeepSeek、ChatGLM 三大系列進入 GitHub 星標前二十。白皮書指出,中國開源模型已 “反向輸出” 至海外,成為美國頭部企業閉源系統的重要參考坐標。
截至發稿,阿里巴巴未就 “Meta 蒸餾千問” 作出評價,但通義千問 GitHub 倉庫 12 小時內新增星標 4200 個,其中 63% 來自北美與歐洲 ID。開發者留言中,“Avocado ingredient”成為最新熱詞。