OpenAI提出Image GPT實(shí)現(xiàn)高質(zhì)量圖像補(bǔ)全和樣本生成

與先進(jìn)自監(jiān)督模型的比較,雖然需要更多的計(jì)算但是本文提出的模型還是能得到更具競(jìng)爭(zhēng)力的結(jié)果。
由于像BERT這類基于掩膜的語(yǔ)言模型在眾多語(yǔ)言任務(wù)上超越了生成模型的結(jié)果,研究人員同時(shí)還利用BERT測(cè)評(píng)圖像模型。研究人員沒(méi)有調(diào)優(yōu)而是使用了15%的掩膜來(lái)去除像素,并從非掩膜的像素中來(lái)預(yù)測(cè)出這些結(jié)果。結(jié)果表明基于BERT模型的線性探測(cè)器具有明顯的劣勢(shì)但卻能在調(diào)優(yōu)下實(shí)現(xiàn)后來(lái)者居上。

BERT和iGPT-L預(yù)訓(xùn)練模型在32x32分辨率上的比較,可以看到生成模型在預(yù)訓(xùn)練階段得到的特征更好,而B(niǎo)ERT模型在調(diào)優(yōu)后則迎頭趕上。
雖然非監(jiān)督學(xué)習(xí)無(wú)需人類標(biāo)記數(shù)據(jù),但近年來(lái)自監(jiān)督學(xué)習(xí)取得了長(zhǎng)足的進(jìn)步,有效使用了有限的標(biāo)注數(shù)據(jù)。成功的半監(jiān)督學(xué)習(xí)方法都使用了像連續(xù)性正則、數(shù)據(jù)增強(qiáng)、準(zhǔn)標(biāo)簽等手段來(lái)實(shí)現(xiàn),純粹基于生成的方法近年來(lái)沒(méi)有顯示出有效的競(jìng)爭(zhēng)力。iGPT-L在這一子領(lǐng)域?qū)鶞?zhǔn)數(shù)據(jù)進(jìn)行了評(píng)測(cè),結(jié)果表明在沒(méi)有圖像增強(qiáng)的情況下性能超過(guò)了Mean Teacher和MixMatch,并接近FixMatch的水平。

與精心設(shè)計(jì)的半監(jiān)督方法不同,iGPT-L在沒(méi)有任何數(shù)據(jù)增強(qiáng)和調(diào)優(yōu)的情況下用于邏輯回歸分類器的擬合,實(shí)現(xiàn)了非常好的半監(jiān)督學(xué)習(xí)結(jié)果。
局限性
雖然iGPT在各種圖像任務(wù)上都很成功,但卻不得不提這種方法的局限性。由于使用了GPT-2中的通用序列遷移器架構(gòu),這種方法需要大規(guī)模的計(jì)算資源,iGPT-L典型情況下需要2500 V-100 GPU日的計(jì)算才能達(dá)到MoGo模型的水平,而后者只需要約70 V100 計(jì)算日的訓(xùn)練。
此外,這一基于transformer模型的輸入分辨率較低,而其他自監(jiān)督方法可以利用卷積編碼器輕松地處理高維度輸入。也許在未來(lái)需要構(gòu)建多尺度transformer的新架構(gòu)來(lái)處理輸入維度受限的問(wèn)題。這一工作僅僅是大規(guī)模語(yǔ)言模型在新領(lǐng)域嘗試的原型驗(yàn)證,無(wú)需領(lǐng)域知識(shí)的人工編碼。然而龐大的計(jì)算量消耗、卷積網(wǎng)絡(luò)的高精度表現(xiàn)使得這一方法在實(shí)際工作中并不實(shí)用。
最后,生成模型會(huì)受到訓(xùn)練序列中偏見(jiàn)的影響。有的對(duì)于構(gòu)建上下文關(guān)系十分有利,但有的卻會(huì)造成不好的結(jié)果。例如在訓(xùn)練數(shù)據(jù)中男性較多就會(huì)造成生成圖像中包含更多的或者完全都是男性,而不是有男有女的場(chǎng)景。在未來(lái)的研究中希望可以對(duì)數(shù)據(jù)進(jìn)行更有效的除偏處理,并更好的理解數(shù)據(jù)偏見(jiàn)與模型的關(guān)系。
利用語(yǔ)言模型GPT對(duì)圖像進(jìn)行處理的想法非常獨(dú)特,實(shí)驗(yàn)也顯示了這種非監(jiān)督方法的對(duì)于全新領(lǐng)域的通用性,在提供足夠計(jì)算資源的情況下序列transformer也許能在未來(lái)為很多新領(lǐng)域提供解決問(wèn)題新思路。
關(guān)于我“門”
將門是一家以專注于發(fā)掘、加速及投資技術(shù)驅(qū)動(dòng)型創(chuàng)業(yè)公司的新型創(chuàng)投機(jī)構(gòu),旗下涵蓋將門創(chuàng)新服務(wù)、將門技術(shù)社群以及將門創(chuàng)投基金。將門成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國(guó)的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。
將門創(chuàng)新服務(wù)專注于使創(chuàng)新的技術(shù)落地于真正的應(yīng)用場(chǎng)景,激活和實(shí)現(xiàn)全新的商業(yè)價(jià)值,服務(wù)于行業(yè)領(lǐng)先企業(yè)和技術(shù)創(chuàng)新型創(chuàng)業(yè)公司。
將門技術(shù)社群專注于幫助技術(shù)創(chuàng)新型的創(chuàng)業(yè)公司提供來(lái)自產(chǎn)、學(xué)、研、創(chuàng)領(lǐng)域的核心技術(shù)專家的技術(shù)分享和學(xué)習(xí)內(nèi)容,使創(chuàng)新成為持續(xù)的核心競(jìng)爭(zhēng)力。
將門創(chuàng)投基金專注于投資通過(guò)技術(shù)創(chuàng)新激活商業(yè)場(chǎng)景,實(shí)現(xiàn)商業(yè)價(jià)值的初創(chuàng)企業(yè),關(guān)注技術(shù)領(lǐng)域包括機(jī)器智能、物聯(lián)網(wǎng)、自然人機(jī)交互、企業(yè)計(jì)算。在近四年的時(shí)間里,將門創(chuàng)投基金已經(jīng)投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數(shù)科技、迪英加科技等數(shù)十家具有高成長(zhǎng)潛力的技術(shù)型創(chuàng)業(yè)公司。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來(lái)了!宇樹(shù)科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉(cāng)中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來(lái)iPhone 時(shí)刻嗎?
- 8 “國(guó)產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗(yàn)
- 9 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





