新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯(cuò)
加入自媒體

營(yíng)收暴增50倍,一季度賺一年的錢,今年最火生意是它

2026-06-10 14:01
鉛筆道
關(guān)注

作者 | 鉛筆道 鄒蔚

編輯 | 鉛筆道 王方

封面圖丨ChatGPT創(chuàng)作

具身智能行業(yè)瘋狂搶數(shù)據(jù)。

"大家極度渴求千萬(wàn)小時(shí)以上的數(shù)據(jù)集……一小時(shí)200塊錢,一千萬(wàn)小時(shí)就是20億元。"基元智航創(chuàng)始人高少龍告訴鉛筆道,為了獲得高質(zhì)量數(shù)據(jù),即使掏出一部分家底,頭部具身智能公司也在所不惜。

"現(xiàn)在一家公司沒有百萬(wàn)小時(shí)數(shù)據(jù),都不好意思說(shuō)自己干具身智能。"竹馬創(chuàng)新創(chuàng)始人張吉說(shuō),百萬(wàn)小時(shí)聽上去很多,實(shí)際上只能滿足具身智能真實(shí)需求萬(wàn)分之一。

如果百萬(wàn)小時(shí)數(shù)據(jù)是基礎(chǔ),也就意味著具身智能入場(chǎng)券至少2億元。

問(wèn)題是,賬上有幾十億也經(jīng)常買不到——高質(zhì)量真實(shí)世界數(shù)據(jù)不夠。

工廠里的裝配動(dòng)作、咖啡店里的服務(wù)流程、家庭里的收納整理、養(yǎng)老院里的照護(hù)場(chǎng)景……這些發(fā)生在現(xiàn)實(shí)世界中的行為,既無(wú)法像互聯(lián)網(wǎng)文本一樣爬取,也無(wú)法像圖片一樣批量下載,它們必須被人一小時(shí)一小時(shí)地采集出來(lái)。

與此同時(shí),資本市場(chǎng)已經(jīng)開始為"賣數(shù)據(jù)的人"買單。

去年6月,數(shù)據(jù)標(biāo)注巨頭Scale AI獲得Meta 143億美元投資,估值達(dá)到290億美元。

今年,數(shù)據(jù)企業(yè)它石智航超4.5億美金融資,創(chuàng)下中國(guó)具身智能行業(yè)單輪融資紀(jì)錄;數(shù)據(jù)傳感器初創(chuàng)企業(yè)淵澈太初創(chuàng)辦5個(gè)月,融資超5億元。

訂單也在滾滾而來(lái)。真實(shí)世界AI數(shù)據(jù)采集公司弈人科技創(chuàng)始人馬成輝告訴鉛筆道,今年Q1具身智能數(shù)據(jù)訂單已經(jīng)過(guò)億,超過(guò)去年全年;靈生科技創(chuàng)始人楊洪兵也向鉛筆道透露,今年具身數(shù)據(jù)訂單營(yíng)收增長(zhǎng)有望超50倍。

在美國(guó),真人數(shù)據(jù)采集公司Mecka.ai一年時(shí)間已拿下1億美元的訂單。

一場(chǎng)圍繞數(shù)據(jù)的新淘金熱,正在上演。鉛筆道對(duì)話了多位數(shù)據(jù)采集行業(yè)從業(yè)者、投資人,發(fā)現(xiàn)行業(yè)賺錢機(jī)會(huì)。

01 -買數(shù)據(jù),2億元

起高少龍,基元智航創(chuàng)始人

基元智航是一家專注于具身智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)域的創(chuàng)新企業(yè),已完成天使輪融資。

今天整個(gè)具身智能行業(yè)幾乎所有公司都缺數(shù)據(jù)。

如果你去問(wèn)國(guó)內(nèi)頭部具身智能公司,他們今天真正希望采購(gòu)的數(shù)據(jù)規(guī)模,最少都是百萬(wàn)小時(shí)起步。

百萬(wàn)小時(shí)是什么概念?

如果按照比較普通的數(shù)據(jù)采集標(biāo)準(zhǔn)計(jì)算,一小時(shí)五六十元,僅僅百萬(wàn)小時(shí)就意味著五六千萬(wàn)元投入。

如果是深度場(chǎng)景數(shù)據(jù),一小時(shí)200元。百萬(wàn)小時(shí)就是2億元。

更尷尬的是,這些公司賬上有幾十億元,買得起數(shù)據(jù),但常常買不到。

AI數(shù)據(jù)標(biāo)注工作界面 來(lái)源:公開資料

由于質(zhì)量不夠高,數(shù)據(jù)規(guī)模不夠大,今天絕大部分模型不是通用模型,而是針對(duì)某一個(gè)特定場(chǎng)景優(yōu)化出來(lái)的模型。

這是整個(gè)行業(yè)共同面臨的困局。

具身智能行業(yè)缺數(shù)據(jù)不是一兩天了,因?yàn)檎鏅C(jī)數(shù)據(jù)根本不通用——我們幾乎把國(guó)內(nèi)主要機(jī)器人廠商都拜訪了一遍。無(wú)論是大廠還是小廠,最終得到的答案高度一致:真機(jī)數(shù)據(jù)只能訓(xùn)練自己的機(jī)器人,無(wú)法直接用于別人的機(jī)器人。

況且,具身智能想要真正像DeepSeek一樣智能涌現(xiàn),大概需要20億小時(shí)的數(shù)據(jù)量級(jí)。這在人類工程史上是一項(xiàng)不可能完成的任務(wù)。

后來(lái)越來(lái)越多論文開始證明,無(wú)(機(jī)器人)本體數(shù)據(jù)是有效的。行業(yè)最終必須尋找新的路徑:回歸到真實(shí)人類行為,人類行為數(shù)據(jù)將成為未來(lái)最大的具身智能數(shù)據(jù)資產(chǎn)。

數(shù)據(jù)有價(jià)值,不代表商業(yè)模式成立,整個(gè)數(shù)據(jù)行業(yè)還有最大痛點(diǎn):盜版。

任何一家機(jī)構(gòu)花100萬(wàn)元買了一份數(shù)據(jù),理論上它都有動(dòng)力把數(shù)據(jù)復(fù)制出來(lái)。復(fù)制二十份,每份賣5萬(wàn)元,成本立刻收回。對(duì)于原始采集公司來(lái)說(shuō),這是最痛苦的事情,也就沒有動(dòng)力去采集高質(zhì)量數(shù)據(jù)。

后來(lái)我們研究自動(dòng)駕駛行業(yè)時(shí)發(fā)現(xiàn),地平線等公司已經(jīng)找到一種新的方式:DaaS(數(shù)據(jù)即服務(wù))。數(shù)據(jù)不離開服務(wù)器,客戶帶著模型進(jìn)來(lái),模型訓(xùn)練完把參數(shù)帶走,數(shù)據(jù)留在原地。數(shù)據(jù)可以復(fù)用,且不必?fù)?dān)心被復(fù)制。這可能才是具身智能數(shù)據(jù)行業(yè)真正的商業(yè)模式。

過(guò)去100元成本的數(shù)據(jù),只能賣一次。未來(lái)100元成本的數(shù)據(jù),可以服務(wù)1000家公司。那平均下來(lái),每家公司只需要承擔(dān)一毛錢成本。數(shù)據(jù)就會(huì)像自來(lái)水一樣,價(jià)格極低,隨取隨用。整個(gè)行業(yè)的數(shù)據(jù)供給會(huì)突然爆發(fā)。

目前業(yè)內(nèi)主流(具身智能)模型公司年數(shù)據(jù)采購(gòu)量最少也都是百萬(wàn)小時(shí)級(jí)別。不同深度的數(shù)據(jù),價(jià)格差異非常大。

最便宜的是普通生活場(chǎng)景數(shù)據(jù)。比如疊被子、擺桌子、整理物品。這些動(dòng)作不需要特別專業(yè)的人,找?guī)讉(gè)勞務(wù)外包人員就能完成。這種數(shù)據(jù)目前大概在五六十元一小時(shí)。

一旦進(jìn)入真實(shí)服務(wù)場(chǎng)景,比如咖啡廳,成本馬上就變了,因?yàn)槟愕贸鲥X讓老板停工配合你。這類服務(wù)場(chǎng)景數(shù)據(jù)的成本通常會(huì)超過(guò)200元一小時(shí)。

工業(yè)機(jī)械臂裝配線,工業(yè)場(chǎng)景數(shù)據(jù)采集成本更高 來(lái)源:公開資料

再往下一層,就是工業(yè)場(chǎng)景。很多人以為工業(yè)場(chǎng)景貴,是因?yàn)椴杉y。其實(shí)不完全是,真正昂貴的是溝通成本,你錢給少了,人不理你。就算給得多,大廠還不見得讓你采,涉及知識(shí)產(chǎn)權(quán)、商業(yè)秘密。工業(yè)數(shù)據(jù)最終價(jià)格至少兩三百元一小時(shí),F(xiàn)在很多激進(jìn)一點(diǎn)的模型公司,對(duì)這類數(shù)據(jù)特別感興趣,哪怕價(jià)格更貴,也愿意購(gòu)買,因?yàn)殡x真實(shí)生產(chǎn)場(chǎng)景更近。

最難采集的,是家庭場(chǎng)景。涉及隱私、財(cái)產(chǎn)、安全。這些問(wèn)題處理起來(lái),遠(yuǎn)比工廠里復(fù)雜。直到今天,行業(yè)在家庭數(shù)據(jù)采集上依然非常保守。

我們大致把客戶分成兩類。

第一類客戶,幾乎什么數(shù)據(jù)都要,他們不挑場(chǎng)景,瞄準(zhǔn)通用具身智能基礎(chǔ)模型,希望自己的模型見過(guò)足夠豐富的世界。未來(lái)再針對(duì)某個(gè)行業(yè)做微調(diào)的時(shí)候,成本會(huì)低很多。目前國(guó)內(nèi)少數(shù)頭部團(tuán)隊(duì)正在這么做。

但第二類企業(yè)占絕大多數(shù)。他們從第一天開始就把自己定義成垂類應(yīng)用。他們采購(gòu)數(shù)據(jù)就盯著未來(lái)最有機(jī)會(huì)落地的場(chǎng)景。

當(dāng)下需求最大的仍然是服務(wù)業(yè)數(shù)據(jù)。這也是為什么我們會(huì)采大量咖啡廳、餐廳相關(guān)數(shù)據(jù)。

我要強(qiáng)調(diào)一點(diǎn):服務(wù)業(yè)并不是具身智能最有價(jià)值的方向。之所以大家都在做服務(wù)業(yè),是因?yàn)榉⻊?wù)業(yè)數(shù)據(jù)最容易獲得。

工業(yè)裝配數(shù)據(jù)、醫(yī)療場(chǎng)景數(shù)據(jù)、深度制造數(shù)據(jù),以前大家根本不知道怎么低成本獲取。既然拿不到數(shù)據(jù),模型廠自然不會(huì)往那個(gè)方向投入,于是市場(chǎng)上形成一種錯(cuò)覺:仿佛服務(wù)業(yè)就是具身智能最重要的方向。

如果未來(lái)有人能大規(guī)模提供制造業(yè)數(shù)據(jù)、醫(yī)療數(shù)據(jù)、工業(yè)裝配數(shù)據(jù)、養(yǎng)老照護(hù)數(shù)據(jù),整個(gè)行業(yè)的方向都會(huì)改變。數(shù)據(jù)公司真正的價(jià)值不是賣數(shù)據(jù),而是創(chuàng)造供給,幫助行業(yè)發(fā)現(xiàn)新的可能性。

今年跟客戶交流,他們對(duì)數(shù)據(jù)的需求變化,有三個(gè)比較明確的方向。

第一是廣度,大家極度渴求千萬(wàn)小時(shí)以上的數(shù)據(jù)集,必須讓模型見過(guò)足夠豐富的世界。

第二是價(jià)格,哪怕一小時(shí)200塊錢,一千萬(wàn)小時(shí)就是20億元。如果數(shù)據(jù)價(jià)格降不下來(lái),模型始終無(wú)法形成商業(yè)閉環(huán)。

第三是深度。具身智能公司今天必須開始回答一個(gè)問(wèn)題:投資人給你那么多錢,你的機(jī)器人到底在哪個(gè)場(chǎng)景里能夠創(chuàng)造價(jià)值?因?yàn)橹挥猩疃葓?chǎng)景數(shù)據(jù),才有可能幫助模型進(jìn)入真實(shí)生產(chǎn)和服務(wù)環(huán)境,最終形成商業(yè)閉環(huán)。

另一個(gè)值得關(guān)注的賺錢方向是AI標(biāo)注。

現(xiàn)在很多人以為采數(shù)據(jù)最貴,隨著數(shù)據(jù)越來(lái)越深入,標(biāo)注往往比采集更貴。

舉個(gè)例子。如果只是普通動(dòng)作數(shù)據(jù),可能找眾包人員就能標(biāo)。但如果是烹飪數(shù)據(jù)呢?里面會(huì)涉及大量專業(yè)動(dòng)作、專業(yè)術(shù)語(yǔ)、專業(yè)流程,你需要懂烹飪的人來(lái)標(biāo),甚至需要專業(yè)廚師來(lái)標(biāo)。廚師的一小時(shí)成本,顯然和普通眾包不是一個(gè)價(jià)格。

隨著未來(lái)越來(lái)越多制造業(yè)數(shù)據(jù)、醫(yī)療數(shù)據(jù)、工業(yè)數(shù)據(jù)進(jìn)入市場(chǎng),這個(gè)問(wèn)題會(huì)更加明顯。

垂類場(chǎng)景的AI自動(dòng)標(biāo)注,是未來(lái)非常值得關(guān)注的方向。未來(lái)很多垂類數(shù)據(jù)集,可能不是靠人標(biāo)出來(lái)的,而是靠AI完成第一輪標(biāo)注,再由專家復(fù)核,這會(huì)極大降低行業(yè)成本。

02 1:20萬(wàn)的缺口

楊洪兵,靈生科技創(chuàng)始人

靈生科技聚焦真實(shí)場(chǎng)景數(shù)據(jù)引擎,已完成多輪數(shù)億元融資。

今年年初,全行業(yè)所有具身智能數(shù)據(jù)加起來(lái),大概只有50萬(wàn)小時(shí)。但如果想訓(xùn)練出真正優(yōu)秀的模型,行業(yè)需要的數(shù)據(jù)量級(jí)大約是千億小時(shí)。

這相當(dāng)于手里只有一個(gè)饅頭,但想吃飽需要二十萬(wàn)個(gè)饅頭。

這就是行業(yè)今天的現(xiàn)實(shí)。不過(guò),數(shù)據(jù)并不是簡(jiǎn)單按小時(shí)計(jì)價(jià)去賣,我們一直反對(duì)把數(shù)據(jù)簡(jiǎn)單理解成商品。

我們將具身數(shù)據(jù)從L1到L5進(jìn)行了嚴(yán)謹(jǐn)分級(jí),還建立了數(shù)據(jù)SLA(服務(wù)等級(jí)協(xié)議)體系,全世界第一次對(duì)數(shù)據(jù)質(zhì)量進(jìn)行了量化管理。

目前市場(chǎng)需求最大的,是L5級(jí)數(shù)據(jù)。為什么L5稀缺?因?yàn)橐髽O高。L5數(shù)據(jù)必須經(jīng)過(guò)詳細(xì)標(biāo)注和任務(wù)切片,必須具備完整的任務(wù)描述、場(chǎng)景描述和物體描述,分辨率通常要達(dá)到1280以上,定位精度要求達(dá)到亞毫米級(jí)。

我一直認(rèn)為,具身數(shù)據(jù)行業(yè)不能停留在“我有數(shù)據(jù),你來(lái)買”的階段。賣水果還有品種區(qū)分,賣石油還有等級(jí)區(qū)分,更何況是訓(xùn)練大模型所需要的數(shù)據(jù)。而有些企業(yè)本身并不真正理解數(shù)據(jù),只是在做二手?jǐn)?shù)據(jù)倒賣。靈生不僅提供高質(zhì)量多模態(tài)數(shù)據(jù),還會(huì)幫助客戶優(yōu)化數(shù)據(jù)管線和底層Infra基礎(chǔ)設(shè)施。

今年我觀察到的最大變化,是Ego數(shù)據(jù)(真人第一視角數(shù)據(jù))需求出現(xiàn)指數(shù)級(jí)增長(zhǎng)。對(duì)比遙操作數(shù)據(jù),Ego的數(shù)據(jù)需求增長(zhǎng)非常明顯。通過(guò)這些數(shù)據(jù)顯著提升了模型效果,同時(shí)采集效率比遙操作高出五倍以上,成本卻更低。

早在去年下半年,海外已經(jīng)明顯開始向Ego數(shù)據(jù)和以人為中心的數(shù)據(jù)轉(zhuǎn)向了。今年上半年,這種趨勢(shì)進(jìn)一步被放大。

另一個(gè)明顯趨勢(shì)是真實(shí)場(chǎng)景數(shù)據(jù)越來(lái)越受歡迎。

舉個(gè)例子,同樣是USB插拔或者線束插拔任務(wù),如果是在素材工廠里采集,場(chǎng)景變化非常有限。但如果是真實(shí)環(huán)境,靈生有幾千名外部數(shù)據(jù)采集員,每個(gè)人的家庭環(huán)境不同、辦公環(huán)境不同、操作習(xí)慣不同,那么最終形成的數(shù)據(jù)變化可能達(dá)到上千種。這種數(shù)據(jù)多樣性,是訓(xùn)練場(chǎng)數(shù)據(jù)很難達(dá)到的。靈生今年預(yù)計(jì)將達(dá)到120萬(wàn)小時(shí)的真實(shí)場(chǎng)景Ego數(shù)據(jù)集。

數(shù)據(jù)行業(yè)亂象之一,就是數(shù)據(jù)精度虛標(biāo)。有企業(yè)宣傳定位精度達(dá)到毫米級(jí),但根據(jù)客戶反饋,真正使用時(shí)漂移非常嚴(yán)重,誤差甚至達(dá)到厘米級(jí),比標(biāo)稱數(shù)據(jù)差十倍以上。

如果希望具身智能產(chǎn)業(yè)長(zhǎng)期健康發(fā)展,就必須結(jié)果導(dǎo)向,訓(xùn)練出真正好用、準(zhǔn)確率更高的模型。而想做到這一點(diǎn),就必須依賴真正高精度、高質(zhì)量、高價(jià)值的數(shù)據(jù)。

從經(jīng)營(yíng)情況來(lái)看,預(yù)計(jì)今年訂單規(guī)模將達(dá)到數(shù)億元級(jí)別,預(yù)計(jì)全年?duì)I收有望達(dá)到去年的50倍以上。我們的客戶主要是頭部具身智能公司,而且多數(shù)會(huì)長(zhǎng)期復(fù)購(gòu)。

我們最關(guān)注的仍然是三個(gè)核心指標(biāo):數(shù)據(jù)質(zhì)量、數(shù)據(jù)多樣性、真實(shí)場(chǎng)景。

03 -融資10億,未必買得到好數(shù)據(jù)

張吉,竹馬創(chuàng)新創(chuàng)始人

竹馬創(chuàng)新是以"3D相機(jī)+AI"為方向的空間智能公司,已完成數(shù)千萬(wàn)元天使輪融資。

具身智能行業(yè)現(xiàn)在缺數(shù)據(jù),缺到什么程度?現(xiàn)在能用到的數(shù)據(jù),可能連需要量的萬(wàn)分之一都不到。

為什么會(huì)這么缺?

第一個(gè)原因是大家不知道缺什么。大語(yǔ)言模型,大家知道去找文本數(shù)據(jù)。具身智能模型,需要眾多模態(tài)數(shù)據(jù)疊加,物理AI、空間智能、尺寸、力學(xué)、關(guān)節(jié)、電流、聲音……哪種數(shù)據(jù)優(yōu)先?只有知道缺什么,才知道怎么補(bǔ)。現(xiàn)在每家公司采集數(shù)據(jù)的方向都不一樣,這是底層結(jié)構(gòu)性困難。

第二個(gè)原因是,文本數(shù)據(jù)可以爬取,但具身智能需要的數(shù)據(jù)在物理世界,天然沒有被數(shù)據(jù)化。既然沒有被數(shù)據(jù)化,就沒法直接拿來(lái)訓(xùn)練。

服務(wù)型機(jī)器人,服務(wù)業(yè)數(shù)據(jù)目前最易獲取 來(lái)源:公開資料

第三個(gè)原因是,現(xiàn)在只能靠采集。采集是按小時(shí)來(lái)的。一個(gè)操作員每天也就七八個(gè)小時(shí),這種方式和時(shí)間線性綁定,很難快速放大。

還有一個(gè)問(wèn)題,因?yàn)椴恢酪裁矗矝]有數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)格式非常亂。很多企業(yè)拿到一些新格式之后,發(fā)現(xiàn)大量數(shù)據(jù)沒法用。數(shù)據(jù)本來(lái)就不多,還被浪費(fèi)掉了。

2026年,行業(yè)突然認(rèn)識(shí)到這個(gè)問(wèn)題了。

去年大家還在卷模型、卷算法,今年突然發(fā)現(xiàn),好像那些帶來(lái)不了很好的效果,數(shù)據(jù)才是最核心的,所有人都開始搞數(shù)據(jù)。特別是很多人突然開始關(guān)注ego數(shù)據(jù),也就是第一人稱數(shù)據(jù),包括我們這種用相機(jī)采集真實(shí)三維數(shù)據(jù)的方式,也突然火起來(lái)。

還有一個(gè)原因,一些來(lái)自智駕行業(yè)的團(tuán)隊(duì)進(jìn)入了具身智能。他們非常堅(jiān)信數(shù)據(jù)一定要來(lái)自真實(shí)場(chǎng)景。因?yàn)橹邱{行業(yè)已經(jīng)證明過(guò),大量真實(shí)數(shù)據(jù)采集非常重要,90%的場(chǎng)景要靠真實(shí)采集。

我覺得這樣下去,具身智能本體企業(yè)不一定能馬上成功,但搞數(shù)據(jù)的這些企業(yè),可能會(huì)成為新一輪獨(dú)角獸。即使不是獨(dú)角獸,最掙錢的也是這一類企業(yè)。

簡(jiǎn)單理解,具身智能需要的數(shù)據(jù)量比互聯(lián)網(wǎng)原來(lái)的數(shù)據(jù)還要大,可能是萬(wàn)倍級(jí)別。那這些數(shù)據(jù)如果都要由數(shù)據(jù)公司提供,市場(chǎng)就會(huì)非常大。

現(xiàn)在一家公司沒有百萬(wàn)小時(shí)數(shù)據(jù),都不好意思談具身智能。真實(shí)物理數(shù)據(jù)按500元一個(gè)小時(shí)來(lái)算,百萬(wàn)小時(shí)就是五億元。

但問(wèn)題是,頭部具身智能公司即便一輪融資10億元,也未必買得到好的高質(zhì)量數(shù)據(jù)。因?yàn)閿?shù)據(jù)不好買,也沒有那么多。所有采集方式和時(shí)間基本還是線性關(guān)系,還沒有一種能指數(shù)級(jí)解決高質(zhì)量真實(shí)數(shù)據(jù)供給的辦法。

對(duì)具身智能公司來(lái)說(shuō),價(jià)值最高的是最早能賣出機(jī)器人的場(chǎng)景數(shù)據(jù)。比如現(xiàn)在很多人在做工廠、物流等工業(yè)級(jí)場(chǎng)景。對(duì)他們來(lái)說(shuō),這些場(chǎng)景的數(shù)據(jù)價(jià)值最高。但對(duì)提供數(shù)據(jù)的公司來(lái)說(shuō),真實(shí)場(chǎng)景的數(shù)據(jù)價(jià)值最高。

只要是真實(shí)場(chǎng)景產(chǎn)生的數(shù)據(jù),就有人買,不一定要嚴(yán)格分場(chǎng)景。如果從數(shù)據(jù)規(guī)模角度看,合成數(shù)據(jù)提供規(guī)模最大。因?yàn)樗皇蔷性增長(zhǎng)。它有機(jī)會(huì)打破靠人和時(shí)間積累的限制。

現(xiàn)在建數(shù)據(jù)工廠的公司應(yīng)該也挺賺錢,而且是隱形掙錢的方向,F(xiàn)在大家都想建,但不知道怎么建,而且很多是政府給錢。這類公司能掙項(xiàng)目錢,但(估值上)未必特別值錢。

所謂數(shù)據(jù)工廠,就是一個(gè)很大的場(chǎng)地,里面有人拿著真機(jī)操作,模擬各種場(chǎng)景采集數(shù)據(jù),一排一排的,就像以前工廠一樣。各地現(xiàn)在都有類似的數(shù)據(jù)工廠。

數(shù)據(jù)工廠的問(wèn)題是規(guī)模化很難,因?yàn)橐咳艘?guī);。它單條數(shù)據(jù)可能貴,但規(guī)模有限。有限場(chǎng)地、有限布置、有限人員、有限時(shí)間,所有東西都是可算出來(lái)的。所以是掙一些辛苦錢。

仿真數(shù)據(jù)現(xiàn)在仍然有需求,而且需求應(yīng)該挺大。仿真數(shù)據(jù)或者合成數(shù)據(jù),有機(jī)會(huì)打破線性增長(zhǎng)邏輯,可能形成指數(shù)級(jí)供給。所以它的需求也不會(huì)少。

而且做仿真數(shù)據(jù)的人,至少目前應(yīng)該是最先掙錢的一撥人。它單價(jià)便宜,但量大。

做數(shù)據(jù)標(biāo)注的公司也肯定會(huì)掙錢。未必是AI標(biāo)注,算法標(biāo)注也可以。只要能把它標(biāo)出來(lái)就行。

總結(jié)一句:能規(guī)模化的公司肯定能掙錢。關(guān)鍵是不要靠人力規(guī);,而是通過(guò)算法規(guī);

現(xiàn)在這個(gè)場(chǎng)景下,提供數(shù)據(jù)都會(huì)掙到錢,只是誰(shuí)掙更多、誰(shuí)掙更少。

但如果從長(zhǎng)遠(yuǎn)看,最后真正能持續(xù)掙錢的,可能還是提供data infra的公司?咳烁悴杉哪J,長(zhǎng)期不一定能掙大錢。

以前SaaS行業(yè)有Databricks(估值1300多億美元)。未來(lái)具身智能行業(yè)里,也會(huì)有很多類似Databricks的data infra公司,不僅提供數(shù)據(jù),還提供數(shù)據(jù)引擎、數(shù)據(jù)閉環(huán)、自動(dòng)化能力、打標(biāo)能力、推理能力、框架能力。

04 -一兩個(gè)月就融能一輪錢

王學(xué)輝,水木清華校友種子基金管理合伙人

水木清華校友種子基金是國(guó)內(nèi)第一支高校校友基金,致力于成為"清華校友創(chuàng)業(yè)第一站"。

數(shù)據(jù)就像具身智能行業(yè)的"石油",現(xiàn)在大家都缺油。

即便是自動(dòng)駕駛這樣一個(gè)相對(duì)固定、單一的場(chǎng)景,也催生出了Scale AI(數(shù)據(jù)訓(xùn)練公司,估值接近300億美元),國(guó)內(nèi)也有很多自動(dòng)駕駛標(biāo)注和數(shù)據(jù)公司掙到錢了。

未來(lái)人形機(jī)器人如果真的進(jìn)入百行千業(yè),數(shù)據(jù)需求會(huì)比自動(dòng)駕駛高好幾個(gè)量級(jí),可能是兩個(gè)數(shù)量級(jí)、三個(gè)數(shù)量級(jí)的差距。

這個(gè)市場(chǎng)會(huì)很大,只是現(xiàn)在無(wú)論本體、具身模型、世界模型,還是數(shù)據(jù)采集路線,都還沒有收斂,各種技術(shù)路線都在百花齊放。

我們布局了靈御智能、淵澈太初、手億科技等數(shù)據(jù)采集初創(chuàng)企業(yè)。像靈御智能,主要是真機(jī)遙操,數(shù)據(jù)質(zhì)量好,但成本相對(duì)高。今年更火的是腕帶技術(shù),包括淵澈太初、手億科技這些公司。

數(shù)據(jù)采集成為大機(jī)會(huì),很大程度上來(lái)自Meta的腕帶技術(shù)。以前大家不太相信肌電技術(shù)能做到那么精準(zhǔn),但Meta把這個(gè)技術(shù)跑通以后,市場(chǎng)開始看到機(jī)會(huì)。據(jù)說(shuō)蘋果下一代產(chǎn)品也可能往這個(gè)技術(shù)路線靠,其他路線可能暫緩。

腕帶技術(shù)跑通以后,大家發(fā)現(xiàn)它不僅可以戴在人手上,也可以戴在機(jī)器人身上,這就把"腕帶"和"數(shù)采"結(jié)合起來(lái)了。人戴腕帶,機(jī)器人也戴腕帶,中間就能形成連接。這是一種技術(shù)創(chuàng)新,也是一種模式創(chuàng)新。

目前數(shù)據(jù)采集公司真正賺錢的還不多,到現(xiàn)在應(yīng)該還沒有(收入成本)打平的,暫時(shí)還沒有盈利。這個(gè)行業(yè)都還很早,一共也就一年多時(shí)間。對(duì)這些公司來(lái)說(shuō),拿到訂單就不錯(cuò)了,盈利暫時(shí)不是主要考慮的問(wèn)題。

如果都量產(chǎn)了,肯定就要死一部分公司,路線也會(huì)收斂一部分。這個(gè)行業(yè)目前最大的痛點(diǎn),大家都還沒有找到最終收斂的路線,很多企業(yè)會(huì)同時(shí)試好幾種方案。

現(xiàn)在很多公司融資都是一兩個(gè)月一輪,很難說(shuō)哪條路線一定更好。水木的策略是,如果技術(shù)路線不明確,我們一般不會(huì)押注某一條路線一定能成。

不只是數(shù)據(jù)公司,具身整機(jī)、具身模型、世界模型也都是這樣,整個(gè)行業(yè)現(xiàn)在都是一兩個(gè)月一輪的狀態(tài)。

具身數(shù)據(jù)行業(yè)會(huì)出現(xiàn)專門做數(shù)據(jù)的巨頭企業(yè)。但頭部具身整機(jī)公司可能會(huì)自己做數(shù)據(jù)。類比汽車行業(yè),像特斯拉、比亞迪這樣的頭部巨頭,很多事情都會(huì)自己做,比亞迪連電池都自己做。機(jī)器人行業(yè)最頭部的幾家公司,大概率也會(huì)全都做。

但這并不意味著第三方獨(dú)立數(shù)據(jù)公司沒有空間。除了最頭部的幾家企業(yè),腰部企業(yè)、尾部企業(yè),以及各種corner case場(chǎng)景、專用機(jī)器人、特種機(jī)器人,都會(huì)存在大量數(shù)據(jù)需求。對(duì)這些企業(yè)來(lái)說(shuō),聯(lián)合使用第三方獨(dú)立數(shù)據(jù)公司,可能是更有性價(jià)比的方式。未來(lái)第三方獨(dú)立數(shù)據(jù)公司的典型客戶,至少會(huì)包括很多腰部企業(yè),這個(gè)量足夠支撐它們成長(zhǎng)為上市公司。

數(shù)據(jù)采集公司比較成熟的商業(yè)模式,現(xiàn)在主要有兩種:一種是一次性賣數(shù)據(jù),另一種是按每臺(tái)機(jī)器人上的數(shù)據(jù)價(jià)值做分成。企業(yè)肯定更希望未來(lái)更多采用按臺(tái)分成的方式,但這里面會(huì)有博弈。

投資人看一家數(shù)據(jù)采集公司是不是好公司,最核心是看訂單怎么樣,有哪些具身整機(jī)企業(yè)在用它,第一線機(jī)構(gòu)和客戶是否使用它,是非常重要的指標(biāo)。

本文為口述者獨(dú)立觀點(diǎn),不構(gòu)成任何投資建議。

       原文標(biāo)題 : 營(yíng)收暴增50倍,一季度賺一年的錢,今年最火生意是它

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)