阿里快樂馬上線,海外觀眾還在求開源

萬眾期待的快樂馬(happyhorse)終于上線。
4月27日,阿里宣布HappyHorse1.0正式開啟灰測。灰測階段,創作者可在HappyHorse官網和阿里云百煉平臺注冊使用,普通用戶可到千問App最新版或官方創作平臺體驗。
快樂馬此前亮相的時候,使用了行業內備受好評的匿名沖榜方案。當它真像一匹脫韁的野馬,登頂各大榜單的時候,你很難不疑惑:這是誰的部將?
大家開始其實都不太相信是阿里的,因為阿里沒有發布過很牛逼的視頻生成模型。而且自己不是內容平臺,缺乏抖音和快手的先天優勢。
最后新成立的ATH事業群出來認領,也算是揚眉吐氣了。
快樂馬來得很是時候,林俊旸前腳離職引發人才流失和研發前景的焦慮,阿里馬上用頂尖模型予以回擊,看起來確實有打噴子臉的效果。
當然這兩件事本身沒有直接聯系,模型研發起碼也要好幾個月,不是三月上馬,四月就能下馬的。
快樂馬出來后,有人去翻負責人張迪的履歷,發現張迪開始是阿里星,后來去快手做可靈技術負責人,去年才回流阿里領導淘天旗下的未來生活實驗室。
而更早之前負責千問的周暢,被字節挖走后帶隊做出了 Seedance2.0 。甚至現在做可靈的蓋坤,當初也是阿里星。
所以這么來說,這兩件事好像又有點聯系,因為人才的來去沒有明顯影響到阿里作為技術組織應對變革的能力。
而林俊旸離開引發的關于開閉源的討論,現在確實有趨勢調整的風頭。
吳泳銘當時回應,稱阿里將繼續堅持開源模型策略,這個策略看起來有些避重就輕了。
阿里不會完全轉向閉源,但以后開源范圍將限制在較小的模型尺寸,大尺寸模型版本將保留給內部賣MaaS。
最新的Qwen3.6系列開源尺寸為35B或27B參數,Qwen3.6-plus只能通過阿里平臺使用。官網發布頁也只提到“將開源更小規模的模型版本,以此重申我們對技術普惠與社區驅動創新的堅定承諾。”

林俊旸離開不是上述調整的原因,但減少了推進的內部阻礙。
他年初曾在某個論壇上表示,自己希望推進Qwen3-Max大模型的開源,但未能如愿。
視頻生成模型那邊,也是類似的過程。阿里通義萬相開源到wan2.2,年初發布wan2.6則開始閉源。而且視頻模型閉源其實引起了更多爭論。
因為你別看當初Sora或者Veo這些模型鬧得很歡,但視頻跟文本兩個東西可用性上有很大差異。
你現在用大模型寫文章或者小說,它的完整度可以做到很高。但你用視頻模型即便只生成一段10s的視頻,抽幾十次卡經常都難以達到滿意的效果。
所以視頻模型出來后,開源社區能做的事情更多。
這一點在wan生態上體現得非常明顯。
最早的wan2.1模型,無論是T2V還是I2V,當時基模能力雖然比其他開源模型強,但也相當粗糙。社區貢獻了大量工作來提升使用體驗。
比如lightx2v這類項目,重構了從采樣策略到顯存優化的一系列推理流程,降低了延遲和成本,同時提高了穩定性。
又比如各種LoRA和輕量化版本,在基礎模型之上添加了很多功能。
甚至連美團都跟學術界合作,在wan2.1這個基模上面,搞出來InfiniteTalk這種解決方案,明顯優化了從音頻驅動、唇形同步到長視頻一致性等方面的能力。
好在當時外賣大戰還沒開始,不算投敵。
這些社區貢獻的東西,都是開源且容易復現的。因此大家都會默認,你后續會從里面吸收東西。
阿里如果一直開源,這顯然是個兩方各自互惠,推動技術進步的好案例。
但當阿里從開源轉向閉源,就免不了有人抱怨你之前是吊開源的凱子,把社區好的工程實踐和idea拿走就不玩了。
事實上,快樂馬最新帖子下面,還有海外觀眾在呼吁開源。我說實話多少有點看不清形勢了。

下面聊聊我具體實測快樂馬 vs seedance2.0 vs kling3.0 的情況。
提示詞:
第一人稱視角(主人視角),鏡頭中不出現主人身體。兩只金毛犬坐在鏡頭前的地面上,專注地盯著即將被丟出的燒餅。主人將一個燒餅從鏡頭前方拋出,燒餅在空中形成清晰拋物線。
左邊的金毛在燒餅剛被拋出的瞬間立刻起跳,張開嘴試圖接住燒餅,但在空中判斷失誤,沒有咬到。燒餅從它嘴邊擦過并繼續下落。右邊的金毛保持冷靜,沒有起跳,而是在地面等待。燒餅落地后被右邊的金毛迅速叼走。兩只狗動作自然流暢,反應真實,避免夸張或卡頓。
這個提示詞是我從經常刷到的一個短視頻博主那里抽取出來的。他有兩只金毛,其中一只明顯更聰明,每次扔燒餅都是先等另外只傻狗上去接,等接不住掉地下,它提前預判點位搶到手。
下面左上是快樂馬、右上是seedance2.0、左下是kling3.0、右下是veo3.1。
生成結果質量排序,我覺得是seedance2.0 ≈ kling3.0 > 快樂馬 > veo3.1。
veo3.1屬于是拉到沒法看,燒餅居然是從狗的嘴里憑空冒出來的,完全的surprise,totally awesome。
seedance2.0和kling3.0結果基本差不多,都比較真實,但都有個小破綻。
seedance2.0是燒餅落到地上跳得太高,kling3.0則是燒餅落地后另一只狗楞了幾秒才從地上叼起來,而我提示詞里說的是“迅速叼走”。
快樂馬這邊問題更多一些。畫面太假,兩只狗看起來很像是cg的。有穿幫畫面,燒餅先掉到狗的鼻子上,結果下一秒就跳到嘴里了。另外也沒有呈現燒餅落到地上的畫面,呈現不夠完整。
所以上面的排序雖然是我覺得,但我覺得還是比較客觀的。
提示詞:
第一人稱視角,畫面中不出現主人。真實環境風格,光照自然。一只貓站在桌子上,桌邊放著一個裝有水的玻璃杯。貓明顯有點心虛,一邊用前爪輕輕把水杯往桌邊推,一邊緩慢后退,同時不斷抬頭看向鏡頭方向,動作帶有試探、猶豫和停頓。水杯在桌面上先是緩慢移動。
推動過程中存在短暫停頓和再次推動的行為。當水杯越過桌邊后開始下落,下落速度逐漸加快,符合重力加速度。水杯落地后傾倒或破裂,杯中的水向四周飛濺,水的運動軌跡自然連續,不粘連、不異常變形。貓在水杯掉落后迅速低頭看向地面,保持警惕狀態。所有運動過程連續自然,無瞬移、無物體消失或重復,符合基本物理規律。
這個提示詞大家的表現就非常一致了,全都爛到令我道心破碎。
不是,到底尼瑪哪些人在說現實不存在了啊?每次出個新模型都在那刷,現實崩了這么多次大伙還在,平行宇宙理論被實錘了。
這四個模型沒有那個呈現出一丁點貓推杯子的動作。
快樂馬的視頻上來貓貓腳上像沾了膠水,碰到就開始把玻璃杯往外面拉。往外拉的時候,玻璃杯倒扣過來,水居然沒往下落,物理學不存在了我只能說。而且杯子落到地上碎渣四濺,但回頭看玻璃杯又完好無損。
seedance2.0視頻里則是貓完全沒碰杯子,杯子在水平桌面上受到信念感召自動下落。水杯落到地面后,跟小區門口六十歲的大爺一樣站得筆直。
kling3.0也是同樣的問題,在貓未接觸杯子的情況下,杯子產生自我意識碰瓷我貓哥。另外,畫面也沒有呈現出杯子落地的效果。
veo3.1稍微好點,貓腳雖然還是沒推杯子,但還是碰了下杯子。杯子傾倒后水沒流出來,照樣不受重力影響。落地后杯子破碎的效果倒是有,但是玻璃渣子多到完全跟一個杯子不對應。
上面這幾個視頻不一定客觀反映模型的能力差異,有可能我的測試數據太少,畢竟AI視頻生成經常需要大量抽卡。
但僅從這些有限的初步測試看,快樂馬的模型跟其他家有沒有特別明顯的差距。
不過目前價格上阿里給了很大折扣,專業會員包月后可以做到最低0.44元/秒,性價比還是拉滿的。
當然,這些評價的前提就是快樂馬不開源,快樂馬只要立馬開源,我將立馬帶頭沖鋒,將其奉為真神。
原文標題 : 阿里快樂馬上線,海外觀眾還在求開源
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













