新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯(cuò)
加入自媒體

微信AI,能避開豆包手機(jī)的窘境嗎?

圖片

相比于技術(shù)路線上的爭議,C端AI生態(tài)還有一個(gè)更加現(xiàn)實(shí)的難題:商業(yè)利益如何分配。

文|游勇

編|周路平

上周,微信AI開啟了小范圍內(nèi)測,外界得以看到這款國民級(jí)應(yīng)用在AI上的一些應(yīng)用場景。這個(gè)叫小微的AI助手,可以幫你總結(jié)朋友圈和公眾號(hào)文章,也可以直接給某位好友發(fā)消息和發(fā)紅包。

除了這些基礎(chǔ)能力,更讓業(yè)內(nèi)關(guān)注的是,微信也在通過AI與外部的服務(wù)打通,讓AI助手具備執(zhí)行、辦事能力,比如給小微發(fā)送指令,實(shí)現(xiàn)了一句話打車、點(diǎn)外賣。當(dāng)用戶在AI對(duì)話界面直接說點(diǎn)一杯冰美式(默認(rèn)語音輸入),小微可以根據(jù)用戶的偏好,自動(dòng)調(diào)用瑞幸或者星巴克等的微信小程序,并且?guī)湍氵x好商品,但會(huì)在小程序內(nèi)讓你確認(rèn)訂單并且手動(dòng)支付。

眼下,包括字節(jié)、阿里、騰訊、螞蟻在內(nèi)的互聯(lián)網(wǎng)大廠,都在推動(dòng)AI從簡單的對(duì)話,向具備執(zhí)行和辦事能力的Agent進(jìn)化。然而,這種AI服務(wù)打通的背后,一方面在考驗(yàn)應(yīng)用生態(tài)的號(hào)召力,另一方面,當(dāng)用戶主動(dòng)打開變成AI主動(dòng)調(diào)用,如何平衡開發(fā)者、用戶與AI入口的關(guān)系,成了Agent服務(wù)能否閉環(huán)的關(guān)鍵。

01 微信與豆包,為何境遇不同

去年底,豆包手機(jī)面世,憑借在AI能力上的大膽嘗試,一炮而紅。當(dāng)時(shí),豆包手機(jī)助手找到了中興手機(jī)合作,獲得了操作系統(tǒng)級(jí)的大量權(quán)限,其中就包括了一個(gè)關(guān)鍵的INJECT_EVENTS權(quán)限,讓AI助手得以通過GUI Agent去讀取屏幕信息,模擬用戶進(jìn)行點(diǎn)擊。盡管未大規(guī)模推廣,但在面世之初,其效果令行業(yè)頗受震動(dòng),不少人將其稱為Agent的一個(gè)里程碑事件。

但豆包手機(jī)在Agent上的嘗試,很快遭到了很多大廠App的抵制,包括微信在內(nèi)的應(yīng)用都拒絕了豆包手機(jī)的訪問。事實(shí)上,手機(jī)廠商自家的AI手機(jī)助手,也擁有類似的系統(tǒng)級(jí)權(quán)限,但擁有大量用戶的手機(jī)廠商在實(shí)際操作中并沒有像豆包手機(jī)如此激進(jìn)。

微信AI則選擇了對(duì)生態(tài)更加溫和的做法,AI接入的服務(wù)需要用戶和開發(fā)者雙向同意。在小微發(fā)布內(nèi)測版本前半個(gè)月,微信就專門發(fā)布了一份《關(guān)于開發(fā)者接入微信AI生態(tài)的指引》,包括京東、美團(tuán)、攜程、肯德基、得物等13家企業(yè)成為微信AI生態(tài)的首批內(nèi)測團(tuán)隊(duì)。

在微信AI的開發(fā)文檔里,提到微信小微的兩種接入方式,其中自動(dòng)模式,無需額外提交代碼,只需在后臺(tái)打開授權(quán)按鈕,適合輕量工具以及功能簡單的小程序。而開發(fā)模式則需要申請,可以結(jié)合業(yè)務(wù)特性做一些接口聲明和改造,適合交易類、醫(yī)療、政務(wù)等對(duì)合規(guī)要求高、業(yè)務(wù)邏輯復(fù)雜的小程序。

圖片

不過,有開發(fā)者告訴數(shù)智前線,微信小微的這種模式并非依賴A2A協(xié)議,而是依托微信自有的小程序生態(tài)和開發(fā)者接口,實(shí)現(xiàn)服務(wù)調(diào)用和任務(wù)執(zhí)行。

“其實(shí)還是把小程序做了MCP接口化改造,就是開放MCP的接口,它不是A2A的這套邏輯。”上述開發(fā)者告訴數(shù)智前線,MCP相當(dāng)于把API包裝成了一個(gè)AI可讀的接口,可以傳數(shù)據(jù),也可以把一些工具封裝在里面。

而應(yīng)用方可以自己決定哪些能力暴露給MCP,哪些能力不對(duì)外暴露。而且,MCP server都會(huì)有一套權(quán)限控制體系,它遵循最小權(quán)限原則,確保大模型僅在安全邊界內(nèi)調(diào)用工具。這意味著,它對(duì)于用戶而言,是一個(gè)安全可控的操作路徑。

業(yè)內(nèi)人士告訴數(shù)智前線,這兩種技術(shù)路線上的差異并沒有優(yōu)劣之分。微信之所以在AI生態(tài)上的號(hào)召力更強(qiáng),除了本身具備龐大的流量池,也與微信十年前開始建設(shè)的小程序生態(tài)密切相關(guān)。微信已經(jīng)接入了數(shù)百萬個(gè)小程序,覆蓋了幾乎衣食住行的方方面面,而這些小程序以微信的標(biāo)準(zhǔn)接口,只需要進(jìn)行一些智能化改造,就能快速被Agent所調(diào)用。

而豆包因?yàn)槿狈?yīng)用生態(tài),只能在最初選擇了更激進(jìn)的GUI路線。甚至在他看來,當(dāng)初不少應(yīng)用大廠打著安全旗號(hào)拒絕豆包手機(jī)的模擬點(diǎn)擊,并非技術(shù)本身有多么可怕,也是擔(dān)心用戶流量被豆包手機(jī)掌控。事實(shí)上,像肯德基、京東、百度等廠商也并沒有禁止豆包手機(jī)的接入。

不過,有消息稱,字節(jié)與中興手機(jī)合作的第二代豆包手機(jī)即將發(fā)布。而新一代的豆包手機(jī)除了“屏幕識(shí)別+模擬點(diǎn)擊”的GUI路線,也在推動(dòng)接口協(xié)議的互聯(lián)互通。

而豆包App也已經(jīng)在加強(qiáng)與外部應(yīng)用的連接,接入了抖音電商和支付的能力,用戶可以在豆包的對(duì)話中直接購買商品。另外,豆包在北京和杭州兩地啟動(dòng)了一鍵打車的灰度測試,用戶直接在聊天框里說出行需求,系統(tǒng)自動(dòng)識(shí)別地點(diǎn)、人數(shù)、偏好,匹配路線和價(jià)格后一鍵確認(rèn)下單。

02 多技術(shù)路線并行成為主流

盡管GUI Agent的做法當(dāng)前存在一些爭議。但這條技術(shù)路線本身的優(yōu)劣勢都比較明顯,靠著圖片識(shí)別+模擬點(diǎn)擊這一套,它可以不用擔(dān)心接口協(xié)議是否已經(jīng)打通,甚至可以不用應(yīng)用方的許可,快速連接大量的應(yīng)用生態(tài),尤其是大量長尾應(yīng)用,用GUI Agent的思路是最快捷的方式。

但代價(jià)在于,這種具有一定侵入性的做法很容易引起應(yīng)用方的警惕,它繞過了底層的協(xié)議對(duì)接。而且,GUI也存在技術(shù)上的短板。比如在遇到小字體、模糊、動(dòng)態(tài)加載、復(fù)雜布局或相似控件時(shí),識(shí)別準(zhǔn)確率難以保證,且視覺模型推理成本較高。以及面對(duì)彈窗、網(wǎng)絡(luò)異常、頁面加載延遲等動(dòng)態(tài)場景,GUI Agent 缺乏底層的系統(tǒng)感知能力,難以準(zhǔn)確判斷當(dāng)前界面狀態(tài),導(dǎo)致操作失敗或死循環(huán)。

攜程在一篇技術(shù)文章里也提到,通過閉源模型在OTA場景進(jìn)行GUI Agent任務(wù)的運(yùn)行時(shí),存在兩類缺陷:一是不理解對(duì) Trip.com 的UI組件的操作方法;二是對(duì)長程任務(wù)(比如 “從大首頁進(jìn)入國內(nèi)酒店列表,選擇一家可訂酒店并進(jìn)入預(yù)訂填寫頁” )的成功率較低。

圖片

另外,相比于直接調(diào)用API接口,GUI的處理方式,對(duì)Token消耗量也比較大。“GUI Agent是現(xiàn)在大家沒有方法互聯(lián)互通的情況下,一種不得已的方案。”IDC分析師孫振亞告訴數(shù)智前線,現(xiàn)在瀏覽器的調(diào)用基本不會(huì)依賴GUI去處理,可以通過CRI去完成大部分的瀏覽器操作,而且非常高效。

但這并不意味著GUI Agent的方案沒有價(jià)值。在業(yè)內(nèi)一場關(guān)于GUI Agent的討論中,與會(huì)嘉賓認(rèn)為Agent技術(shù)正趨向于API調(diào)用和視覺能力相結(jié)合的混合模式。這意味著Agent既能通過精確的API接口與成熟的系統(tǒng)(如訂票、訂酒店的App)高效交互,也能通過視覺理解和操作那些沒有API的通用圖形界面(GUI)。

比如訂機(jī)票、聽音樂等高頻、標(biāo)準(zhǔn)化的任務(wù),Agent可以通過API調(diào)用快速、穩(wěn)定地完成。而大量非標(biāo)準(zhǔn)化的長尾任務(wù),則需要依賴屏幕識(shí)別+模擬點(diǎn)擊的方式來實(shí)現(xiàn)。

OPPO ColorOS 智慧產(chǎn)品研發(fā)總監(jiān)姜昱辰的判斷是,GUI Agent是中間過渡形態(tài),未來將走向A2A。

智能體與智能體之間的互聯(lián)被認(rèn)為是未來比較理想的做法,它能夠最大化兼顧數(shù)據(jù)安全性、保證用戶留存、均攤Token 開銷,能夠比較好的兼顧各方利益。

但信通院也提到,智能體交互的問題在逐步顯現(xiàn),比如身份可信、授權(quán)邊界、數(shù)據(jù)安全和責(zé)任追溯等問題。不同平臺(tái)、不同主體開發(fā)的Agent進(jìn)入同一交互網(wǎng)絡(luò)后,需要明確“誰在發(fā)起請求、代表誰發(fā)起請求、是否具備相應(yīng)權(quán)限”。而不同廠商若各自構(gòu)建封閉協(xié)議體系,可能造成新的生態(tài)壁壘和重復(fù)建設(shè),不利于智能體產(chǎn)業(yè)健康發(fā)展。

6月26日,市場總局在智能體互聯(lián)標(biāo)準(zhǔn)化新聞發(fā)布會(huì)上明確提到,不同廠商智能體間接口、協(xié)議不統(tǒng)一,形成“智能體孤島”,嚴(yán)重制約了規(guī)模化協(xié)同應(yīng)用。而在去年,相關(guān)機(jī)構(gòu)已經(jīng)在國家標(biāo)準(zhǔn)層面推出了AIP智能體互聯(lián)協(xié)議。

事實(shí)上,無論是互聯(lián)網(wǎng)大廠還是手機(jī)等終端系統(tǒng)廠商,目前在AI服務(wù)的接入上普遍采用了多種技術(shù)路線并行的思路。Google I/O大會(huì)上演示的Gemini Spark,就同時(shí)支持OCR模擬點(diǎn)擊、合作軟件API接入和A2A三種方案。

而谷歌在去年發(fā)布的APP function框架,也是通過一套標(biāo)準(zhǔn)的接口規(guī)范,幫助第三方的App應(yīng)用和AI模型進(jìn)行對(duì)接。

比如三星Galaxy S26就通過這套框架引入了谷歌的Gemini智能體,三星手機(jī)應(yīng)用商城排名前200的應(yīng)用都能支持Gemini去調(diào)用。用戶可以對(duì)Gemini下達(dá)指令,找出相冊中的特定照片,并用短信發(fā)送給朋友。而整個(gè)過程中,Gemini不需要打開相冊和短信App,而是通過AppFunctions,把對(duì)應(yīng)入口抓取到Gemini之中執(zhí)行操作,效率更高。

除了谷歌,蘋果也有類似的框架App Intents。在蘋果的構(gòu)思中,用戶可以使喚 Siri 來操作各種 App,而底層實(shí)現(xiàn)方式就是通過 App Intents。

榮耀手機(jī)的YOYO智能體平臺(tái)也對(duì)不同開發(fā)者提供了三種接入方式:智能體A2A接入,MCP接入和插件接入。比如榮耀AI服務(wù)將卡片配置成通用模板,開發(fā)者無需經(jīng)過設(shè)計(jì)、開發(fā)、配置、測試等復(fù)雜流程,只需根據(jù)對(duì)應(yīng)的模板卡片提供內(nèi)容,即可將智能體服務(wù)嵌入榮耀YOYO智能體對(duì)話流中。螞蟻的AI助手阿福就是通過這種方式接入了榮耀YOYO智能體。

“通過Agent去調(diào)應(yīng)用,未來肯定是一個(gè)趨勢。”信通院分析師馬銘洋告訴數(shù)智前線。

03 AI入口之爭,考驗(yàn)利益的重新分配

當(dāng)互聯(lián)網(wǎng)大廠和手機(jī)等終端廠商都在積極搶占AI時(shí)代的入口時(shí),相比于技術(shù)路線上的爭議,C端AI生態(tài)還有一個(gè)更加現(xiàn)實(shí)的難題:商業(yè)利益如何分配。

業(yè)內(nèi)人士告訴數(shù)智前線,企業(yè)內(nèi)部的多Agent協(xié)同已經(jīng)比較普遍,比如企業(yè)數(shù)據(jù)分析領(lǐng)域,背后調(diào)用了數(shù)據(jù)洞察Agent、數(shù)據(jù)融合Agent、歸因分析Agent,每個(gè)Agent負(fù)責(zé)一個(gè)清晰的任務(wù),最終交付一個(gè)完整的結(jié)果。但在ToC的應(yīng)用上,與第三方App的智能體互聯(lián)還比較少。

這背后除了多Agent系統(tǒng)本身還不成熟外,更核心原因在于,相比于在企業(yè)內(nèi)部的多智能體應(yīng)用,這些通用的AI助手要連接外部服務(wù)時(shí),不可避免遇到新的商業(yè)分配的難題。無論是何種技術(shù)路線,都無法回避同一個(gè)問題:當(dāng)用戶主動(dòng)打開變成AI主動(dòng)調(diào)用,用戶的意圖和需求以及后續(xù)的服務(wù)選擇又掌握在了AI助手的手里,甚至整個(gè)操作都可以不用跳轉(zhuǎn)到第三方平臺(tái),App管道化的擔(dān)憂一直存在。

即便是微信打造的小程序生態(tài)里,本質(zhì)還是用戶直接去搜索獲得服務(wù),應(yīng)用方接入小程序相當(dāng)于多了一個(gè)觸達(dá)用戶的渠道。但AI時(shí)代,則變成了AI主動(dòng)理解需求、選擇服務(wù),小程序變成了被動(dòng)響應(yīng)。而用戶屬于誰,服務(wù)會(huì)如何編排調(diào)度,用戶沉淀,成本如何分擔(dān)目前都沒有一個(gè)清晰的說法。

這種底層商業(yè)邏輯的變化也讓一些開發(fā)者對(duì)AI助手的服務(wù)調(diào)用并不積極。

詩詞App西窗燭在去年對(duì)Apple Intelligence和華為小藝做過適配,但選擇的是成本最低的輕量級(jí)接入,僅做頁面跳轉(zhuǎn)、參數(shù)透傳,AI助手并不能直接讀寫App內(nèi)部數(shù)據(jù)或者自動(dòng)操作。

圖片

“不跳App,沒流量。”西窗燭創(chuàng)始人瞿章才告訴數(shù)智前線,這也是目前第三方應(yīng)用的一個(gè)糾結(jié)之處,當(dāng)AI作為統(tǒng)一的服務(wù)調(diào)度入口,App開始管道化,傳統(tǒng)依賴廣告變現(xiàn)的生存模式遭遇挑戰(zhàn)。而且,即便不是A2A,只是給AI助手提供API接口,每次的API請求都會(huì)有對(duì)應(yīng)的IT資源消耗,對(duì)于小團(tuán)隊(duì)也是一筆不小的開支。

另外,多智能體協(xié)同背后產(chǎn)生的Token成本誰來承擔(dān),現(xiàn)在還沒有一個(gè)明確的說法,“整體形態(tài)很新,其實(shí)監(jiān)管側(cè)包括產(chǎn)業(yè)形態(tài),我感覺都沒有成熟。一般來說,反正那倆大廠也不缺錢,可能暫時(shí)Token由他們來付吧。”馬銘洋說。

不過,也有不少應(yīng)用方選擇了深度接入。比如東方財(cái)富、國泰海通證券就通過封裝了多個(gè)Skills,接入華為小藝,直接在小藝助手上完成選股、查行情,全程留在對(duì)話界面。

在業(yè)內(nèi)人士看來,這些偏服務(wù)性以及需要強(qiáng)大線下履約能力的應(yīng)用,更有動(dòng)力與這些通用型的AI助手合作,因?yàn)樽罱K服務(wù)的落地依賴這些廠商提供,反而能獲得更多的精準(zhǔn)流量,比如滴滴、高德、肯德基。另外,像金融、健康類的應(yīng)用需要專業(yè)的知識(shí)體系支撐,往往也更愿意被AI助手調(diào)用,比如東方財(cái)富、螞蟻阿福等。反而是需要靠廣告變現(xiàn)和依賴競價(jià)排名的應(yīng)用,有著更多的顧慮,AI助手直接調(diào)用服務(wù),在一定程度上減少了用戶打開App的機(jī)會(huì),也讓用戶關(guān)系難以在自己的池子里沉淀。

這場AI Agent的探索和博弈才剛剛開始,不管是技術(shù)、用戶體驗(yàn)還是商業(yè)化都還在初期。但可以肯定的是,一個(gè)繁榮的生態(tài)必然是開發(fā)者、用戶和AI入口都能從中受益。

       原文標(biāo)題 : 微信AI,能避開豆包手機(jī)的窘境嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)