新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

Agent還沒來,昇騰已經把從硬件到軟件的路鋪好了

2026-05-29 18:21
智能相對論
關注

文 | 智能相對論

作者 | 陳泊丞

從去年開始,中國大模型能力已經追到了全球第一梯隊。MiniMax M2.5、Kimi K2.5的Token消耗量在OpenRouter上長期位居前列,DeepSeek V4也常被拿來與GPT-5對標。但很多人忽略了,這些模型之所以“能跑”,是因為現有算力底座“夠用”。

那什么時候“夠用”會不夠用呢?答案是Agent時代。而且,在這個階段,“能跑”和“跑得舒服”,又是兩碼事。

在今年的鯤鵬昇騰開發者大會2026——昇騰AI開發者峰會2026上,昇騰給出了一個更底層的量化洞察:過去一年,模型調用頻次暴漲50到100倍,序列長度從Chatbot時代的4K飆升至接近1M,相當于250倍的跨度。MoE推理對時延的要求也越來越苛刻,正從10毫秒向1毫秒級別逼近。

圖片

這不是“模型變大了”的量變問題,而是整個算力底座的底層邏輯需要被重寫的質變信號。所以,真正的問題不是“現有算力夠不夠”,而是當Agent的胃口以指數增長,不僅消耗得更多,而且創造的需求在井噴,那么現有算力架構的“夠用”還能撐多久?

基于這個視角,我們會發現,昇騰今年在峰會上講的三件事,即超節點架構創新、軟件全面開源開放、開發者體驗升級,背后的本質上都是在回答同一個問題:算力底座如何從“能跑模型”進化到“天然親和Agent”?

這不是三個獨立的議題,而是從硬件到軟件到開發者的一整條技術鏈,必須在Agent前夜完成的一次系統性重構。

超節點,讓幾千上百個NPU之間擰出一股更強大的力量

Chatbot時代,序列長度約4K,KVCache命中一次就夠,NPU之間的通信壓力不大,也是可控的。

但進入Agent時代,推理鏈路拉長到接近1M tokens,KVCache需要跨NPU頻繁跳躍。這時候,問題就不僅是“帶寬夠不夠”,而是一個架構級命題——NPU和NPU之間怎么通信,直接決定了系統能不能跑得更好。

傳統方案下,每個NPU掛載獨立內存,跨NPU訪問要走消息語義,也就是send/recv那一套,單次通信在微秒級。

昇騰超節點天然親和Agent負載。而判斷超節點的核心標準其實只有一個,即“是否實現了全域內存統一編址”。在這里,昇騰950芯片的架構創新,實現了SIMT與SIMD雙編程模式的一體化融合,在三件事上同時做到了這一點。

一是內存語義的革命。基于靈衢互聯協議和總線控制器,AIC/AIV通過MTE指令直接訪存遠端內存,無需拷貝。對比傳統以太網,在基于靈衢互聯的超節點架構下,MTE指令一個操作就能完成。其中差的不是量的優化,而是質的重構。

二是全域內存統一編址。全局單一虛擬地址空間下,NPU和CPU直接用虛擬地址訪問任意位置,無需改代碼、無需路由、無需拷貝。KV Cache實現全局共享,超長上下文無縫擴展。

三是內存池化帶來的效率躍遷。通過片上內存和DDR的分層池化能力,以查代算,KV Cache查詢命中率大幅提高。在LLM、推薦、Engram等典型場景,查詢時延降低3到4倍,訓練和推理吞吐相比傳統集群提升3到4倍。

三層疊加,通信RTT時延壓縮到了3微秒,帶寬更是達到TB級。這才是超節點的真正價值——并非“堆更多的NPU”,而是讓每一個Token都更高效、更經濟。

所以,這次峰會給出的核心判斷很直接:互聯能力決定超節點能力,系統綜合性能取決于超節點規模與單芯片性能規格的乘積。那么,當互聯帶寬達到T級,超節點要做的就不是“堆更多的NPU”,而是重新定義芯片之間怎么通信。

但物理上限只是入場券。真正決定算力生態命運的,是硬件造出來之后的又一核心問題:軟件的門檻有多高?開發者真的愿意來嗎?

昇騰要走自己的路

吸引開發者的關鍵是開源,但開源這件事的底層邏輯已經變了。

過去很多硬件的所謂“開源”,是在圍墻外開一扇窗——你能看到代碼,但不能改核心層,更不能參與路線決策。

這是“開放姿態”,不是“開源生態”。為什么要計較這個區別?因為開源和“看上去開源”,打開的是兩種完全不同的生態前景。

真開源意味著開發者敢在你平臺上持續投入——代碼他能改、路線他能參與、技術迭代更新不會某天突然停止。假開源則意味著他永遠得留一條退路,做的每一行優化都可能白費。而在Agent時代,當軟件需求開始井噴、新場景以周為單位涌現,開發者選擇哪個生態建基礎設施,本質上是信任——信任這個平臺不會因為封閉而讓他走回頭路。

所以,“開放姿態”能吸引圍觀,“開源生態”才能留住人。

因此,昇騰這次在開源開放的道路上走得更徹底,其核心不同就在于它正在構建一個完整、高效、開放的算子開發體系,讓開發者無論從哪個入口進來,都能找到自己的路徑。

追求極致性能的工程師,可以用Ascend C做細粒度控制如計算、訪存、流水,每一步都可調。同時,昇騰還推出了Tensor API、支持Host-device混合編程、新增CCU通信能力。

而注重快速創新的AI算法工程師,則可以用TileLang或Triton——這兩個主流開源生態接口已經實現了100%兼容,性能達到Ascend C的0.6到0.9倍,開發周期壓縮到一周。目前更支持超600個Triton算子和300個TileLang算子。

當然,想在性能和效率之間找甜點區的開發者,還可以選PyPTO。

此外,在這套多路徑算子編程體系的另一端,CANNBot 算子智能體則是把“最后一公里”也打通了。它將微架構優化經驗融入技能庫,單個Vector算子生成僅需3小時,從生成到部署全流程1天,相比傳統人工開發效率提升5倍以上。同時,配合覆蓋22類典型算子的評測集以及內置了4000多個評測點的自動化驗證體系,讓開發者完全不用再從零摸索。

以上,加上AscendNPU IR編譯底座的全面開源、聯合30余家企業與高校共建的15個以上生態算子庫,昇騰正在向外界與開發者們拋出一個關鍵的橄欖枝——在這里,從零寫一個算子,已經不需要“專家身份”了。

在「智能相對論」的視角中,開源的真正分水嶺,從來不是放出了多少代碼,而是開發者能不能在昇騰上從頭寫一個算子。現在,答案開始變成了“能”。

當然,開了門是一回事,讓人留下來又是另一回事。這取決于第三個維度——開發者體驗。

開發者體驗的飛輪,已經全面轉了起來

過去一個模型從想法到部署的路徑,需要調研生態兼容性、手工適配算子、搭建驗證環境、手動量化、部署調試等,結果下來周期往往得按周來算,而且每一步都需要全方面能力,而“全方面”就意味著門檻。

但是,我們在DeepSeek-V4-Flash的昇騰實際部署中,卻看到了不一樣的路徑——1分鐘就可以完成模型狀態檢索、一天內完成適配,再經過小時級的自動驗證和量化后,30分鐘就可以輸出部署服務和模型文檔。相較于傳統手搓,效率提升4倍,如果考慮環境差異因素,那就遠遠不止4倍了。

圖片

這是如何做到的?不是工具變多了,是昇騰把“專家經驗”變成了“系統能力”。

具體來看,我們發現,有兩套機制正在驅動這個變化的實現。

第一套是Skills體系。4000多名昇騰工程師多年調優積累的經驗、踩過的坑、驗證過的最佳實踐,在這里被結構化沉淀為200多個可調用的Skills模塊。它們兼容Claude Code、Codex、OpenClaw等主流Agent平臺,兩行命令就能調用。以前要找對人才能解決的問題,現在Skills里直接就有了。

第二套是Agentic工作流。如今,開發者只需要描述意圖,7個基礎Agent自動編排接力,調研、適配、優化、部署全流程自動化。以前是“人找工具”,現在直接成了“工具找人”,昇騰從根本上改寫了開發者的工作范式。

以上,我們所看到的,更多是從技術層面來拉升開發者體驗。但是,若要開發者體驗的飛輪全面轉起來,或許光靠技術還不夠,昇騰又進一步給出了兩套新體驗。

一是零成本的試錯空間。一鍵自動部署、平均兩分鐘跑通首個Demo、上萬卡算力資源投放支撐開源社區——這里要解決的不僅是算力成本,更是“第一次嘗試”的心理門檻。很多開發者不是不想用新平臺,是怕花了時間還跑不通。在這里,昇騰把“試一試”的成本大幅降低,本質上就是在消除這個心理阻力。

二是可兌現的職業回報。聯合頭部互聯網企業打造三層認證體系,附帶簡歷推薦、大廠實習等權益,昇騰正在讓“我能用好昇騰”這件事本身具有商業化的職業流動性。不難想象,開發者留在一個生態里,從來不只是因為工具好用,而是因為他在這里積累的技能能換取實打實的外部回報。正視這一需求,遠比想象的要重要。

那么,這兩樣東西疊加之后,傳遞給開發者的信息就很清楚了——來昇騰,不需要從頭開始。不管是對于開發者,還是對于昇騰,飛輪已經全面轉起來了。

寫在最后

在超節點巔峰對話直播中,我們看到了一個來自產業端的判斷,“當智能生產軟件的方式變得更高效,人類對軟件的需求會井噴。以前的軟件太昂貴,很多需求被壓抑了。”

對應來說,Agent時代不僅在消耗更多Token,它還在創造過去根本不存在的新需求——軟件不再是標準化產品的復用,而是每個人、每個場景的即時定制。這種需求一旦釋放,對算力的渴求不再是線性的,而是爆炸式的。正如Anthropic聯創Jack Clark的判斷,2028年Agent可能進入自主進化,屆時Token消耗將進入非線性增長通道。

兩條線指向同一個結論,Agent時代的到來是不能等的。你不可能等Agent全面爆發之后再補架構的課、開軟件的源、降開發者的門檻——那相當于堵車的時候才開始修路。

因此,回過頭來看昇騰在峰會上鋪開的三件事,本質上是對這一判斷的三重回應。

首先,超節點重新定義了NPU之間的通信范式,讓Agent時代的算力消耗不再被延遲墻鎖死。這里為Agent時代打好硬件基礎。

其次,CANN的多路徑算子編程體系加CANNBot,讓任何一個開發者都能在昇騰上從零寫出高性能算子。這里為Agent時代夯實軟件能力。

最后,Skills體系和Agentic工作流,把4000個工程師的經驗打包成每個新手的起點。這里為開發者們鋪好“好用易用”的路徑。

三道能力疊加在一起,也就解釋了昇騰今天要做的事,不是在應對當下,而是在對標一個還沒到眼前、但已經在路上的Agent時代。

*本文圖片均來源于網絡

       原文標題 : Agent還沒來,昇騰已經把從硬件到軟件的路鋪好了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號