建議所有 MaaS廠商開(kāi)通瘋狂星期四套餐
周四是我一周消耗 token 最多的一天,得盤(pán)工作進(jìn)度了吧,得review了吧,得寫(xiě)周報(bào)了吧。
打開(kāi) Claude Code,輸入“幫我總結(jié)一下這周的工作”——額度先瘋狂了。寫(xiě)完周報(bào)33%額度沒(méi)了。別的活兒還沒(méi)干呢, token 限額了。
200 刀的套餐,3.5 小時(shí)就用完。一個(gè)任務(wù)恨不得扣掉 30%。
問(wèn)題是:不知道Token 都花在哪兒了。
前幾天,Claude code的代碼被烏龍打包上傳之后,經(jīng) Reddit 用戶(hù)逆向工程發(fā)現(xiàn),Anthropic 終于承認(rèn)了:Claude Code 確實(shí)在亂扣費(fèi)。Anthropic 官方終于承認(rèn)了——在 Reddit 用戶(hù)爆破式吐槽并甩出逆向工程證據(jù)后,官方賬號(hào)回應(yīng):“正在緊急排查,目前是最高優(yōu)先級(jí)問(wèn)題”。
這是一個(gè)工程問(wèn)題,一方面是Harness 架構(gòu)雖然能讓 AI 能搞定復(fù)雜任務(wù),但代價(jià)是開(kāi)銷(xiāo)遠(yuǎn)高于單模型對(duì)話(huà);另一方面是 Claude 本身的流量算法確實(shí)存在疏漏。
我知道了,agent 在瘋狂偷吃我的 token 。要是想得到好的結(jié)果,肯定要多喂 token 。
所以國(guó)產(chǎn)的 MaaS 們是不是也面臨同樣情況呢?是不是至少可以保證在AI 們的高峰使用額度提供一個(gè)可解決的方案呢?
所以我建議MaaS們每周四開(kāi)通 token 瘋狂星期四,token 暢用,V 我五十助我智能飛升。

應(yīng)用層的黑箱里藏著什么?
Claude Code 為什么好用?因?yàn)樗皇菃我荒P停且惶锥嘀悄荏w流水線(xiàn)。寫(xiě)代碼的、評(píng)審的、審核的,各跑各的。這些子智能體的 token 消耗,被打包進(jìn)“一次對(duì)話(huà)”里。
Harness 架構(gòu)讓 AI 能搞定復(fù)雜任務(wù),但是token 開(kāi)銷(xiāo)確實(shí)爆炸。據(jù)社區(qū)測(cè)試,復(fù)雜任務(wù)下的 token 消耗可能是直接調(diào)用模型的數(shù)倍甚至十倍以上。這個(gè) overhead,被廠商打包進(jìn)“一次對(duì)話(huà)”的賬單,用戶(hù)完全感知不到。
更隱蔽的是 Coding Plan 內(nèi)部的模型調(diào)控。Plan Mode、Reviewer、Debugger 這些角色,每次切換都是隱性調(diào)用。你以為自己在和“一個(gè) AI”對(duì)話(huà),實(shí)際上后臺(tái)可能在五六個(gè)子智能體之間來(lái)回跳轉(zhuǎn)。
然后是那個(gè)被 Reddit 大神逆向出來(lái)的真相:兩個(gè)獨(dú)立的 cache bug,讓 prompt cache 完全失效。這其中存在兩個(gè)比較要命的 bug 。
Bug 1:Sentinel 替換機(jī)制破壞緩存
Claude Code 為了在不同平臺(tái)(Windows/macOS/Linux)分發(fā),使用了獨(dú)立的二進(jìn)制文件。當(dāng)對(duì)話(huà)內(nèi)容涉及計(jì)費(fèi)內(nèi)部邏輯時(shí),系統(tǒng)會(huì)用 sentinel 值替換敏感字段。但問(wèn)題就出在這里——這種替換破壞了 prompt cache 的哈希一致性,導(dǎo)致緩存明明應(yīng)該命中,卻被判定為未命中,重復(fù)計(jì)算 token。
Bug 2:Resume 參數(shù)強(qiáng)制刷新緩存
從 v2.1.69 版本開(kāi)始,resume 參數(shù)(用于恢復(fù)中斷的對(duì)話(huà))會(huì)強(qiáng)制讓緩存失效。這意味著只要你中途退出或切換設(shè)備,之前的上下文緩存就全部作廢,系統(tǒng)會(huì)重新計(jì)算整個(gè)對(duì)話(huà)歷史的 token。對(duì)于長(zhǎng)上下文的重度用戶(hù),這是致命的——每次“繼續(xù)剛才的對(duì)話(huà)”,都是在燒錢(qián)。
這兩個(gè) bug 的疊加效應(yīng)是災(zāi)難性的。假設(shè)你讓 Claude Code 讀一個(gè) GitHub PR,正常情況下緩存應(yīng)該幫你節(jié)省 90% 的重復(fù)計(jì)算費(fèi)用。但因?yàn)?bug,你每次都按全額付費(fèi),成本膨脹 10-20 倍。
所以 harness 結(jié)構(gòu)不僅有著爆炸的消耗,還會(huì)因?yàn)樗惴▎?wèn)題,加速計(jì)費(fèi)。
更有意思的是,官方是在用戶(hù)逆向工程發(fā)現(xiàn) bug 后才出來(lái)回應(yīng)的。正如網(wǎng)友吐槽:“你們擁有世界最好的模型和開(kāi)發(fā)者,卻無(wú)視成千上萬(wàn)投訴,直到被人拆解了才承認(rèn)。”
這種“用戶(hù)先發(fā)現(xiàn),廠商后承認(rèn)”的模式,在 AI 行業(yè)已成慣例。ChatGPT Plus 的歷史額度從沒(méi)退還過(guò),Gemini Advanced 的“變慢”也從不提前通知。Anthropic 的問(wèn)題不在于出了 bug,而在于缺乏基本的計(jì)費(fèi)可觀測(cè)性(Observability)——當(dāng)用戶(hù)質(zhì)疑賬單時(shí),他們拿不出數(shù)據(jù)證明自己沒(méi)錯(cuò)。
對(duì)比隔壁的 OpenClaw,幾乎是每周一到兩更,有問(wèn)題連夜修。而 Anthropic 的回應(yīng)速度,暴露了一個(gè)殘酷現(xiàn)實(shí):當(dāng)模型能力成為護(hù)城河,用戶(hù)體驗(yàn)和計(jì)費(fèi)透明度就成了可以犧牲的代價(jià)。
技術(shù)債務(wù)被轉(zhuǎn)嫁給了用戶(hù)。你付的錢(qián)里,多少是“真的在用 AI”,多少是“系統(tǒng)在浪費(fèi)”?沒(méi)人知道。
國(guó)內(nèi) MaaS 廠商做的如何?
既然 Claude Code 的應(yīng)用層是黑箱,那回到國(guó)內(nèi) MaaS 廠商,他們做得如何?
說(shuō)實(shí)話(huà),國(guó)內(nèi)的 MaaS 們普遍良心多了。至少在 API 層,國(guó)內(nèi)廠商確實(shí)拆得更細(xì)。但在應(yīng)用層,大家依然把 Harness/Agent 調(diào)度成本藏在黑箱里:

基于 token 本身,可以發(fā)現(xiàn)大家的收費(fèi)都是透明可追溯的,但到了應(yīng)用層,也就是實(shí)際解決問(wèn)題的時(shí)候,似乎還不能做到完全透明,也許是因?yàn)榇蠹疫基本都在 Openclaw 的框架中沒(méi)有推陳出新。
從 OpenClaw 的火熱開(kāi)始,各家都開(kāi)始部署定制的 token 套餐。不過(guò)設(shè)置限額以及“靈活調(diào)配”老舊模型的情況在這些套餐里確實(shí)經(jīng)常發(fā)生,以及高峰時(shí)段配額不足導(dǎo)致卡頓也是家常便飯,倒閉用戶(hù)有時(shí)候只能通過(guò)API按量付費(fèi),其實(shí)這樣會(huì)有些本末倒置: 定額套餐不能滿(mǎn)足用戶(hù),回頭又轉(zhuǎn)向了按量付費(fèi)的舊模式。
可以說(shuō),收費(fèi)透明只停留在 API 層。當(dāng)你使用agent 調(diào)取 token 的時(shí)候的 AI 應(yīng)用,調(diào)度成本基本是黑箱。雖然現(xiàn)在如 Kimi 、火山等也在通過(guò)額度限制 agent 的使用次數(shù),但是套餐中額度使用完畢后就就能等到刷新。
API 層透明適合開(kāi)發(fā)者,應(yīng)用層透明適合企業(yè)采購(gòu)——當(dāng)你需要向老板解釋“為什么這個(gè)月 AI 花了 2 萬(wàn)塊”時(shí),“調(diào)用了 500 次深度研究 Agent”比“消耗了 100 萬(wàn) token”更有說(shuō)服力。而有意思的是,在這六家中,只有百度將 Agent 成本顯性化,其他五家仍把 Harness 調(diào)度成本打包在 Token 中。
這不是錢(qián)的問(wèn)題,是“用戶(hù)是否擁有對(duì)自己計(jì)算資源的知情權(quán)”。
云計(jì)算時(shí)代,沒(méi)人會(huì)接受“一臺(tái)服務(wù)器 $200/月,但不知道 CPU 和帶寬各多少”。
AWS 的賬單可以精確到毫秒級(jí)的計(jì)算時(shí)長(zhǎng)、字節(jié)數(shù)的流量消耗、甚至不同可用區(qū)的價(jià)格差異。可觀測(cè)性才是云計(jì)算成熟的基礎(chǔ)。
AI 應(yīng)用還在蠻荒時(shí)代。廠商們把 Harness 調(diào)度、多智能體協(xié)作包裝成“魔法”,把技術(shù)債務(wù)包裝成“使用量”,本質(zhì)是在剝奪用戶(hù)的知情權(quán)。
用戶(hù)需要一張明細(xì)清晰的賬單,至少給一個(gè)“調(diào)試模式”開(kāi)關(guān),讓開(kāi)發(fā)者可選查看 Harness 調(diào)用鏈;至少對(duì)因 bug 導(dǎo)致的計(jì)費(fèi)錯(cuò)誤,承諾自動(dòng)退費(fèi)而非“正在調(diào)查”;至少把“你花了多少錢(qián)”和“你應(yīng)該花多少錢(qián)”區(qū)分開(kāi)來(lái)。
鑒于現(xiàn)在的 MaaS 廠商的進(jìn)步步調(diào)如此之快,下周瘋狂星期四,我希望至少知道我的 Token 是怎么被吃掉的。V 我50,讓我多吃?xún)蓧K原味雞。
原文標(biāo)題 : 建議所有 MaaS廠商開(kāi)通瘋狂星期四套餐
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線(xiàn)督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線(xiàn)下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專(zhuān)題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來(lái)了!宇樹(shù)科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉(cāng)中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來(lái)iPhone 時(shí)刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 9 “國(guó)產(chǎn)GPU第一股”摩爾線(xiàn)程首季扭虧,但造血能力仍待考驗(yàn)
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





