24FPS實(shí)時(shí)生成!騰訊混元推出WorldPlay:打破“速度與記憶”悖論,720P無(wú)限流視頻隨意玩!
作者:Wenqiang Sun等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 WorldPlay,一個(gè)針對(duì)通用場(chǎng)景的實(shí)時(shí)、長(zhǎng)期一致的世界模型。 雙重動(dòng)作表示:提出了一種結(jié)合離散鍵盤(pán)輸入和連續(xù)攝像機(jī)姿態(tài)的雙重動(dòng)作表示
徹底告別VAE!清華x可靈聯(lián)手開(kāi)源SVG-T2I:生成理解合二為一,性能媲美SD3
作者:Minglei Shi等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 首次在視覺(jué)特征模型(VFM)特征空間上對(duì)文本到圖像的隱擴(kuò)散模型進(jìn)行了大規(guī)模驗(yàn)證。 開(kāi)源了SVG-T2I模型的完整訓(xùn)練與推理流程,并提供多個(gè)
年終盤(pán)點(diǎn):誰(shuí)會(huì)成為中國(guó)的"Nano Banana"?
?有界UnKnown原創(chuàng) 作者丨山茶 編輯|錢(qián)江 回顧2025年,AI行業(yè)最重要的變化不是模型,而是Agent真正進(jìn)入工作流。 11月,Nano Banana一經(jīng)發(fā)布就在創(chuàng)作工具賽道撕出一道缺口。它不
視頻模型降維打擊?浙大&哈佛提出 IF-Edit:無(wú)需訓(xùn)練,用“生成視頻”的思路修圖!
作者:Zechuan Zhang等 解讀:AI生成未來(lái) 論文標(biāo)題: Are Image-to-Video Models Good Zero-Shot Image Editors? 機(jī)構(gòu): 浙江大學(xué)、哈
鐵釘水上漂、子彈穿蘋(píng)果不炸?Nano-Banana等17款SOTA模型顫抖迎物理邏輯推理大考!
作者:Tianyang Han等 解讀:AI生成未來(lái) 本文第一作者Tianyang Han是美團(tuán)MeiGen團(tuán)隊(duì)的算法研究科學(xué)家,主要研究方向是圖像生成和多模態(tài)大語(yǔ)言模型。 亮點(diǎn)直擊 PicWorld
NeurIPS 2025 | 硬剛可靈1.5!阿里通義&清華等開(kāi)源Wan-Move:指哪動(dòng)哪的“神筆馬良”
作者:Ruihang Chu等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 Wan-Move,一個(gè)用于圖像到視頻生成中運(yùn)動(dòng)控制的框架。與需要運(yùn)動(dòng)編碼的現(xiàn)有方法不同,它通過(guò)編輯條件特征注入運(yùn)動(dòng)引導(dǎo),無(wú)需添加新模塊,從
1步頂100步!TwinFlow:無(wú)需教師模型,僅單步推理,Qwen-Image-20B生成速度漲100倍!
作者:Zhenglin Cheng等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 簡(jiǎn)單而有效的一步生成框架。提出了一種一步生成框架,該框架不需要輔助訓(xùn)練模型(GAN 判別器)或凍結(jié)的教師模型(不同的/一致性蒸餾),
原生多模態(tài)統(tǒng)一架構(gòu)比不過(guò)單模態(tài)專(zhuān)家模型?華為團(tuán)隊(duì)出品的EMMA “Say No”
作者:Xin He, Longhui Wei等 解讀:AI生成未來(lái) 背景與動(dòng)機(jī) 當(dāng)前多模態(tài)大模型已經(jīng)成為大模型領(lǐng)域最為重要的研究熱點(diǎn),尤其是隨著OpenAI的GPT-4O展現(xiàn)出極強(qiáng)的多模交互生成能力,
北航&美團(tuán)等最新EditThinker:給AI修圖裝上“大腦”,F(xiàn)lux、OmniGen2瞬間智商暴漲!
作者:Hongyu Li等 解讀:AI生成未來(lái) 圖1。EditThinker 概述。子圖(a)展示了多輪思考編輯流程,該流程迭代批評(píng)、優(yōu)化和重復(fù)編輯指令,子圖(b)報(bào)告了四個(gè)圖像編輯基準(zhǔn)測(cè)試的結(jié)果,展
僅用1張圖1小時(shí),比肩FLUX.1和Qwen,推理狂飆5倍!Glance用“快慢哲學(xué)”顛覆擴(kuò)散模型!
作者:Zhuobai Dong等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 極致高效的訓(xùn)練:僅需?1 個(gè)樣本,在?單張 V100 GPU?上不到?1 小時(shí)?即可完成訓(xùn)練。這與需要數(shù)千GPU小時(shí)(如 DMD2 需要
6799元起!影翎Antigravity A1深度評(píng)測(cè):小白交互,專(zhuān)業(yè)影像
帶來(lái)了傳統(tǒng)無(wú)人機(jī)給不了的快樂(lè)。 在今年 7 月份時(shí),雷科技收到影石Insta360 的邀請(qǐng),第一時(shí)間體驗(yàn)了由影石Insta360 和第三方一起孵化的影翎Antigravity 帶來(lái)的首款全景無(wú)人機(jī)——
港科大等提出音頻驅(qū)動(dòng)多人視頻生成新范式 AnyTalker,解鎖任意數(shù)量角色間的自然互動(dòng)!
作者:Zhizhou Zhong等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 可擴(kuò)展的多人驅(qū)動(dòng)結(jié)構(gòu):本文提出了一種可擴(kuò)展的多流處理結(jié)構(gòu) Audio-Face Cross Attention Layer,能夠以循環(huán)
多模態(tài)理解生成“大一統(tǒng)”!Meta&港大等重磅發(fā)布Tuna:統(tǒng)一視覺(jué)表征,性能碾壓Show-o2
作者:Zhiheng Liu等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 Tuna,一個(gè)采用統(tǒng)一視覺(jué)表示的原生統(tǒng)一多模態(tài)模型,在一個(gè)單一框架內(nèi)實(shí)現(xiàn)了圖像/視頻理解、圖像/視頻生成和圖像編輯。 廣泛的實(shí)驗(yàn)表明,Tu
《黑客帝國(guó)》雛形已現(xiàn)?騰訊造出“可對(duì)話(huà)游戲宇宙”,實(shí)時(shí)生成、任意交互,世界為你改變!
作者:Junshu Tang等 解讀:AI生成未來(lái) Hunyuan-GameCraft-2將生成式游戲世界模型從靜態(tài)游戲場(chǎng)景視頻合成提升到開(kāi)放式、遵循指令的交互式模擬。 合成交互視頻Pipeline展
給圖像生成配“閱卷老師”!RubricRL拒絕黑盒瞎蒙,用細(xì)粒度量表馴服大模型,指哪改哪!
作者:Xuelu Feng等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 提出通用化基于量規(guī)的獎(jiǎng)勵(lì)設(shè)計(jì)方案,可同時(shí)適用于擴(kuò)散模型與自回歸文生圖模型; 構(gòu)建提示詞自適應(yīng)、可分解的監(jiān)督框架,顯著提升模型訓(xùn)練的可解釋性與
圖像生成開(kāi)源界又出“王炸”!南洋理工&階躍星辰發(fā)布iMontage:解鎖“多對(duì)多”生成新玩法!
作者:Zhoujie Fu等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 iMontage統(tǒng)一模型,能夠處理可變數(shù)量的輸入/輸出幀,有效銜接了視頻生成與高動(dòng)態(tài)圖像生成領(lǐng)域。 構(gòu)建任務(wù)無(wú)關(guān)的時(shí)序多樣化數(shù)據(jù)pipeli
ICCV`25 | 視頻交互“隨心所欲”!復(fù)旦&通義萬(wàn)相等開(kāi)源DreamRelation:讓想象力從此無(wú)邊界
作者:Yujie Wei等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 首個(gè)關(guān)系導(dǎo)向的視頻定制框架:本工作首次嘗試解決“關(guān)系視頻定制”任務(wù),即基于少量樣本視頻,生成具有特定交互關(guān)系(如握手、擁抱)但主體不同的新視頻
再見(jiàn)VAE!英偉達(dá)PixelDiT硬剛SD/FLUX:破局像素生成,端到端效果比肩隱空間模型
作者:Yongsheng Yu等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 PixelDiT,一種單階段、完全基于Transformer的像素空間擴(kuò)散模型,無(wú)需單獨(dú)的自編碼器即可進(jìn)行端到端訓(xùn)練。 證明了高效的像素
Nano Banana Pro再次封神!我總結(jié)了9種邪修用法
這哪是"出圖更好",簡(jiǎn)直是把AI圖像生成推進(jìn)了下一個(gè)紀(jì)元。 一致性王者圖片模型Nano Banana Pro(基于Gemini 3 Pro Image)發(fā)布才20小時(shí),人類(lèi)創(chuàng)作者的進(jìn)度可能還停在“剛摸
端到端像素?cái)U(kuò)散天降外掛!北大&華為等開(kāi)源DeCo:生圖質(zhì)量超越SD3、OmniGen2等
作者:Zehong Ma等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 DeCo解耦框架:DiT專(zhuān)注低頻語(yǔ)義建模(采用下采樣輸入);輕量級(jí)像素解碼器重建高頻信號(hào)。 創(chuàng)新頻率感知損失函數(shù):通過(guò)DCT轉(zhuǎn)換至頻域;基于J
資訊訂閱
- 精彩回顧 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》 查看回顧
- 精彩回顧 OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì) 查看回顧
- 精彩回顧 Ansys Motion薄膜卷曲卷對(duì)卷工藝仿真解決方案 查看回顧
- 精彩回顧 STM32全球線上峰會(huì) 查看回顧
- 精彩回顧 2024視覺(jué)感知技術(shù)在半導(dǎo)體與印刷包裝創(chuàng)新大會(huì) 查看回顧
- 精彩回顧 全數(shù)會(huì)2024中國(guó)人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會(huì) 查看回顧
- 1人形機(jī)器人“第一股”來(lái)了!宇樹(shù)科技即將上會(huì)
- 2華為,重大突破!
- 3支付寶推出全球首個(gè)Token Pay服務(wù),AI時(shí)代的支付要變天了?
- 4內(nèi)測(cè)“紅技能”,小紅書(shū)才是真正的AI App Store?
- 5一周股評(píng)|A股逆勢(shì)跳水,你被割肉了嗎?
- 6馬斯克的星艦V3上天,中國(guó)的民營(yíng)航天迎來(lái)生死局?
- 7實(shí)測(cè)GPT For PPT:5分鐘出稿質(zhì)量堪憂(yōu),打工人“最后一公里”還得自己走
- 8為什么邊緣計(jì)算終于有了它的殺手級(jí)應(yīng)用
- 9算力告急,四大力量涌入Token服務(wù)市場(chǎng)
- 102萬(wàn)億美元的火星船票,SpaceX開(kāi)啟人類(lèi)史上最大IPO
-
加密芯片筑牢工業(yè)設(shè)備防抄板防線2025-11-14
-
LKT4202UGM、LKT4305GM國(guó)密芯片2025-10-31
-
金融級(jí)安全加密芯片-LKT43042025-04-10
-
ATSHA204A國(guó)產(chǎn)全兼容芯片LCSHA2042025-02-27
-
耗材保護(hù)芯片-LKT4304解決方案2025-02-13
-
LKT4304新一代算法移植加密芯片2025-01-16

