新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

重大更新!Google翻譯接入Gemini 3.5 LT,我們實測了一波

2026-06-12 10:16
雷科技
關注

翻譯成了最值得關注的AI落地場景之一。

前段時間舉行的 Google I/O 上,Google 正式發(fā)布了新一代 Gemini 3.5 模型,同時也提到未來會將 Gemini 的能力融入到 Google 生態(tài)的更多產(chǎn)品中。

但讓雷科技沒想到的是,第一個用上 Gemini 的 Google 生態(tài)應用并不是搜索、Youtube、地圖等 Google 生態(tài)大戶,而是近幾年存在感不斷降低的 Google 翻譯:昨天,Google 發(fā)布 Google 翻譯更新,在翻譯中加入了最新的音頻模型 Gemini 3.5 Live Translate(下文簡稱 Gemini 3.5 LT)。

圖片來源:Google

那么在 Gemini 3.5 LT 的驅(qū)動下,Google 翻譯的實時語音翻譯功能體驗又如何呢?

錯詞漏詞依舊存在,單向翻譯模式存硬傷

打開 Google 翻譯的實時翻譯功能,選擇「實時聽」模式,就能進入全新的 Gemini 3.5 LT 驅(qū)動的翻譯模式了。不過奇怪的是,這個「實時聽」模式必須連接外置耳機才能激活。考慮到 Google 翻譯這個實時聽模式并不能像時空壺同傳模式那樣雙向同時工作,雷科技對這個「必須接耳機才能用」的設計實屬不解。

好在這個「實時聽」模式的操作還算簡單:打開實時聽模式,把手機靠近對方,耳機里就能「實時」聽到翻譯后的音頻了。

微信圖片_20260611192213_47_50.jpg

圖片來源:雷科技

和 Google 翻譯之前那個按住才能說話、松手才開始翻譯的「對話」模式相比,實時聽模式會在對方完成一個短句后開始翻譯,時效性要高不少。但在翻譯時,Google 依舊有比較明顯的延遲。

以中譯英的古詩翻譯為例,要念到第三句時,耳機里才會聽到第一句的翻譯,和專業(yè)同傳耳機那種幾乎「同時啟動」的翻譯還是有點差距。

至于翻譯準確性的問題,雷科技這里給 Google 翻譯安排了幾個比較經(jīng)典的游戲?qū)υ挕冈暣蟮褂糜跍y試,同時也拉來了蘋果翻譯和有道翻譯作為對比。

我們先來看看原文,相信玩過 GTA:SA 的玩家對這段點餐錄音都不會陌生:

I'll have 2 number 9s, a number 9 large, a number 6 with extra dip, a number 7, 2 number 45s, one with cheese and a large soda. 

以下是 Google 翻譯「聽」到的英文原文:

Now, I have two number nines, but number nine Lord, number six with extra dip, a number seven, two number 45s, one with cheese and a large soda. Okay.Okay.

可以看到,即使是由 Gemini 3.5 LT 驅(qū)動的 Google 翻譯,在一些細節(jié)處也會錯過原文,比如:

I’ll have 變成了 I have(連讀遺漏);

a number 9 large 變成了 but number nine Lord(識別錯誤);

開頭、結尾處也多了 Now 和 Okay.Okay.(識別幻覺)。

不過在翻譯效果方面,Google 翻譯倒是準確的把這個錯誤的原文翻譯了出來。

微信圖片_20260611192348_48_50.jpg

圖片來源:雷科技

而在語音渲染方面,Google 翻譯輸出的語音和單純的 TTS 語音相比,確實更有節(jié)奏感,更像是真人說出來的,但依舊能聽出這是 AI 合成語音。

相比之下,Apple 翻譯的問題就大得多了:識別出現(xiàn)大量錯誤,翻譯幾乎不可用。

微信圖片_20260611192425_49_50.jpg

圖片來源:雷科技

有道的同傳效果反而更穩(wěn)定,只出現(xiàn)了一處連讀遺漏(「I’ll have」變成了「I have」)和一處識別錯誤(「Soda」變成了「Soup」),翻譯質(zhì)量和速度也同樣穩(wěn)定。

微信圖片_20260611192542_50_50.jpg

圖片來源:雷科技

另外,Google 翻譯這個「實時聽」模式還有一個很奇怪的地方:不知道出于什么原因,Google 翻譯不會保存「實時聽」的翻譯記錄:

除了「實時聽」,Google 翻譯還有「對話」「文本」等多種翻譯模式,后者在翻譯結束后都能從歷史記錄里看到原文與翻譯的文本。但「實時聽」模式下的翻譯記錄在退出該模式(耳機斷開導致的強制退出也算)后全部消失。

如果你打算用 Google 翻譯的「實時聽」模式做采訪記錄,那雷科技勸你還是放棄這個想法。

微信圖片_20260611192636_51_50.jpg

圖片來源:雷科技

另外,在體驗中雷科技還發(fā)現(xiàn) Google 翻譯的「實時聽」模式依舊存在錯譯和主語混亂的情況。但從好的方面想,即使是真人翻譯也難免會出現(xiàn)錯譯、漏譯的情況,而 Google 翻譯這類翻譯軟件能以更快的速度迭代技術、查漏補缺。

更重要的是,作為全球通用翻譯賽道的代表,Google 翻譯加入 AI 陣營,必將推動整個通用翻譯賽道朝著 AI 翻譯轉(zhuǎn)型。

翻譯成了最值得關注的AI落地場景之一

其實把 Google 翻譯這次更新單獨拿出來看,雷科技認為這只能算得上是一次「AI 功能補課」:別人都在接大模型,Google 翻譯當然也要接。但如果把視角放到 2026 年整個 AI 硬件市場,雷科技反而覺得翻譯可能是今年最值得關注的 AI 落地場景之一。

原因也不復雜:和很多還停留在「炫技」階段的 AI 功能相比,「翻譯」的需求足夠明確,也足夠高頻。不同于需要「教育用戶」「創(chuàng)造需求」的品類,品牌不需要解釋「加 AI 能干什么」,用戶也不會質(zhì)疑「為什么要用 AI」。

比如時空壺此前推出的 X1 Meeting AI 會議同傳設備,就利用時空壺的 AI 模型能力,解決了同傳過程中斷句點識別、語義推測、上下文糾錯的傳統(tǒng)短板。在「翻譯」之外,時空壺也用 AI 技術打造了骨聲紋識別功能,讓翻譯耳機可以準確識別哪句話是從誰嘴里說出來的,為后面的同傳翻譯環(huán)節(jié)打下基礎。

2433ae6ec31c4b64a5790ae3cdc52097.jpg@0-0-1706-1023a.jpeg

圖片來源:雷科技

訊飛剛發(fā)布的 AI 眼鏡則是另一條路線。自誕生以來,主流智能眼鏡都圍繞「拍攝」這一核心場景來打造產(chǎn)品。但上個月發(fā)布的訊飛 AI 眼鏡別出心裁地將「全場景翻譯」定為 AI 眼鏡的核心。

d8c0bfbf9628418b98c7096da94b07bb.jpg

圖片來源:雷科技

以翻譯替代拍攝,這不僅用更高頻的場景解決了智能眼鏡「吃灰」的問題,也充分發(fā)揮了訊飛自己的優(yōu)勢,借助訊飛在翻譯領域多年的技術積累,以最快的速度讓訊飛 AI 眼鏡在智能眼鏡賽道立足。

而在雷科技看來,無論時空壺同傳耳機,還是訊飛 AI 眼鏡,這些 AI 翻譯設備本質(zhì)上都在試圖讓翻譯從一個 App 功能,變成一種可以「移植」到不同硬件中的能力,從而覆蓋更多的場景。

以 Google 翻譯為例,雖然現(xiàn)階段的 Google 翻譯還面臨延遲、漏譯、記錄缺失等問題;但長遠來看,Gemini 3.5 LT 的實時音頻能力完全可以接入耳機、眼鏡、會議設備,甚至汽車座艙當中。

對時空壺、訊飛這類專業(yè)翻譯硬件廠商來說,Gemini 3.5 LT 的出現(xiàn)既是壓力,也是機會。「壓力」很好理解:Google 這樣的玩家一旦下場,必然會抬高用戶對免費翻譯工具的預期——去年各手機品牌先后為 TWS 耳機加入 AI 翻譯功能,就直接擠壓了入門翻譯耳機的市場空間,拉高了翻譯耳機能力的「及格線」。

e277a48932e943c69e2c33376e1f11b9.png

圖片來源:京東

但從另一個角度想,通用翻譯也有著天然的短板:商務會議需要多人識別,采訪需要留備份,跨境展會需要長時間續(xù)航,嘈雜環(huán)境需要更強收音,這些都不是單靠一個模型更新就能解決的。

也正因如此,Google 翻譯變強并不意味著翻譯耳機、翻譯眼鏡的故事就此結束。

Google 翻譯等通用翻譯 App 和采用通用翻譯模型的產(chǎn)品,只能解決「從無到有」的問題。而未來的高端翻譯耳機,必將把專用 AI 能力當作產(chǎn)品迭代的核心驅(qū)動力,用更快、更強的專用翻譯模型拉開體驗的差距。也只有這樣,才能在 AirPods 等「AI 翻譯耳機」帶來的沖擊下守住核心用戶群,并在更細分、更高價值的市場中延續(xù)優(yōu)勢。

隨著免費 App 把基礎翻譯門檻越拉越低,專業(yè)設備就必須在專業(yè)場景中證明自己的實力和價值。可以肯定的是,隨著 AI 技術在翻譯賽道的普及,翻譯硬件也必將迎來新一輪的洗牌。

技術迎來革新、產(chǎn)品優(yōu)勝劣汰、消費者體驗升級,這才是 AI 技術推動行業(yè)發(fā)展的意義。

谷歌谷歌翻譯GeminiAI翻譯實時翻譯

來源:雷科技

本文圖片來自:123RF 正版圖庫       來源:雷科技

       原文標題 : 重大更新!Google翻譯接入Gemini 3.5 LT,我們實測了一波

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號