“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略
自然交互+知識計算背后是AI平臺
搜狗聽寫不會是搜狗唯一的一款人工智能產(chǎn)品,在王小川的規(guī)劃中,人工智能是搜狗下一階段的重要戰(zhàn)略。
早在2012年,搜狗便開始研發(fā)智能語音技術(shù),并開始布局相關(guān)產(chǎn)品的落地。去年8月3日,搜狗舉行知音引擎發(fā)布會,取得機器翻譯的突破。跟進當時世界上最領(lǐng)先的機器翻譯的深度學習框架,基于attion的端到端的框架,加上搜狗以前在語音識別上的累積,用3個月時間,搭建起知音引擎,并應用于去年的烏鎮(zhèn)大會,該引擎在今年5月份奪得WMT2017中英機器翻譯的全球冠軍,;去年11月份,搜狗推出了機器同傳,率先商用化...
這樣的案例很多。搜狗在去年年底推出了一款機器人“汪仔”,面向搜索引擎,實時的抓取海量信息,根據(jù)問題的上下文,通過文本的分析、自然語言處理的能力,把用戶想要的答案提取出來。在今年5月份GMIS2017會上,“汪仔”與人工速記進行了五輪PK,最終以4:1完勝。
“到現(xiàn)在為止,我們可以很堅定的說,機器的識別能力與人工速記相比,已經(jīng)取得了本質(zhì)性的領(lǐng)先。”王硯峰說。
然而語音識別同樣存在挑戰(zhàn)。王硯峰說,語音識別產(chǎn)品未來要解決的,一是遠場的問題——人與人之間的遠距離喊話,大家可以聽得很清楚,但機器的遠距離識別是不好的;二是噪聲聲音識別問題。
彼時搜狗的人工智能戰(zhàn)略還只是個輪廓:自然交互+知識計算,如今,輪廓變?yōu)榭蚣埽压芬呀?jīng)形成一個AI技術(shù)體系及平臺。
平臺由四個階層組成,底層是大數(shù)據(jù)和深度學習技術(shù);倒數(shù)第二層是語言的AI、語音的AI、圖像的AI,搜狗的核心是語言,圖像和語音都是圍繞語言的交互方式;再上一層就是行業(yè)應用;最頂層就是搜狗的輸入法和搜索兩款產(chǎn)品。
搜狗作為一家人工智能公司,在AI落地方面做得遠遠不夠。也正因此,下半年將在硬件、軟件等場景集中一波攻勢。具體而言,搜狗接下來會往三個方向發(fā)力:
1、在可穿戴、車載、客廳場景下,自主研發(fā)更多的硬件。比如搜狗在上個月已經(jīng)發(fā)布了一款產(chǎn)品“智能副駕”,主打的模式就是通過多輪對話、地圖知識和對話能力的結(jié)合,把它變成更好的導航對話引擎。
2、搜狗會積極推廣AI云平臺、AI云服務,服務更多的行業(yè)伙伴。
3、在更多的垂直場景下做產(chǎn)品。
基于搜狗的語音能力和自然交互能力,在非巨頭壟斷的行業(yè),搜狗將嘗試做更多硬件產(chǎn)品的自研、試水、投資,可能自己研發(fā),也可能投資一些公司,以合作的方式把這些產(chǎn)品做出來。
在王硯峰看來,不論是車載市場、家庭場景,還是可穿戴市場,雖然玩家很多,但市場格局還未定型,在這個過程中,王硯峰認為搜狗完全有信心拿出更多爆款產(chǎn)品或有量產(chǎn)品,來搶占市場份額,例如在中國可穿戴設(shè)備硬件中排名前五名的糖貓兒童手表,目前出貨量已突破100萬。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
2 華為,重大突破!
- 1 人形機器人“第一股”來了!宇樹科技即將上會
- 2 全球股市陷AI獨大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉中國機器人
- 7 Figure AI 交付突破350臺,陪跑特斯拉會迎來iPhone 時刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導力的兩種情景報告
- 9 “國產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗
- 10 特斯拉宣布監(jiān)督版FSD登陸中國?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













