機(jī)器翻譯真的可以取代翻譯員的工作嗎?
我們生活常用的機(jī)器翻譯成為翻譯活動(dòng)中的重要的輔助工具。而機(jī)器翻譯錯(cuò)譯、死譯頻出,給翻譯工作帶來諸多不便。近年來,“大數(shù)據(jù)”的出現(xiàn)為機(jī)器翻譯帶來了新希望,其獨(dú)特的“4V”特點(diǎn)將對(duì)機(jī)器翻譯產(chǎn)生革命性的影響。科多大數(shù)據(jù)帶大家來看看大數(shù)據(jù)在機(jī)器翻譯中的應(yīng)用是怎么樣的。

大數(shù)據(jù),即大量的數(shù)據(jù),在一定程度上可以理解為多個(gè)大語料庫(kù)的結(jié)合體。維克托·邁爾提出大數(shù)據(jù)有容量大、種類多、速度快和價(jià)值高四大特征。容量大、種類多保證了它為譯者提供一個(gè)包含各種資源的巨型共享資料庫(kù);速度快、價(jià)值高可提高翻譯的效率和精確度。譯者要意識(shí)到大數(shù)據(jù)共享資源的重要性,充分利用其來查找翻譯所需的相關(guān)資源。

大數(shù)據(jù)時(shí)代,利用信息技術(shù)進(jìn)行輔助翻譯是翻譯工作者一項(xiàng)必備技能。經(jīng)濟(jì)全球化快速發(fā)展帶來各國(guó)交流頻繁,各種翻譯應(yīng)接不暇,利用信息技術(shù)進(jìn)行輔助翻譯是大勢(shì)所趨。下面主要圍繞兩種輔助翻譯工具展開:塔多思與谷歌。
Trados是一種翻譯記憶軟件。它將譯員做過的工作用Trados提供的工具存儲(chǔ)起來,放到兩個(gè)主要的數(shù)據(jù)庫(kù)中:句料庫(kù)和術(shù)語庫(kù)。Trados基于數(shù)據(jù)庫(kù)原理,利用翻譯記憶,將已譯資源以句子為單位存入數(shù)據(jù)庫(kù),翻譯時(shí)系統(tǒng)自動(dòng)對(duì)源語言文本進(jìn)行分析,與數(shù)據(jù)庫(kù)中的翻譯記憶進(jìn)行匹配,100%匹配的句子可自動(dòng)替換;部分匹配的句子根據(jù)匹配度提出翻譯建議;全新的句子可通過系統(tǒng)提供的建議進(jìn)行人工翻譯;而每一次翻譯又作為新翻譯記憶積累入數(shù)據(jù)庫(kù)。這樣將機(jī)器與人工相結(jié)合就幫助譯者提高了翻譯效率和準(zhǔn)確性。Trados能夠自動(dòng)替換日期、時(shí)間和度量單位等,如句料庫(kù)中有2008年5月,譯文中出現(xiàn)May,2017時(shí)就會(huì)自動(dòng)替換為2017年5月。
谷歌翻譯使用的是基于統(tǒng)計(jì)的翻譯方法,所有語言知識(shí)都是從語料庫(kù)中自動(dòng)獲取,通過概率模型對(duì)語料庫(kù)中的句子進(jìn)行概率計(jì)算后生成。來自互聯(lián)網(wǎng)的幾乎所有語言文本,構(gòu)成了谷歌的龐大的語料庫(kù)。谷歌翻譯還利用網(wǎng)絡(luò)資源不斷補(bǔ)充和更新。所以在谷歌翻譯中輸入源語言文本后,系統(tǒng)會(huì)根據(jù)概率模型對(duì)語料庫(kù)中的句子進(jìn)行概率計(jì)算搜索出最優(yōu)化和使用頻次最高的譯文,如輸入“Nopains,nogains.”,便會(huì)生成譯文“不勞則無獲。”

(一)優(yōu)勢(shì)
大數(shù)據(jù)時(shí)代,基于平行語料庫(kù),翻譯多樣性和準(zhǔn)確性成為可能。語料庫(kù)幫助提供真實(shí)語料、提供統(tǒng)計(jì)數(shù)據(jù)、驗(yàn)證現(xiàn)行的理論、構(gòu)建新的理論。例如,紅樓夢(mèng)中前80回出現(xiàn)了1219個(gè)“某某笑道”,該如何翻譯呢?全譯為smiledandsaid,不僅重復(fù),而且抹去了經(jīng)典名作的文學(xué)特色。這時(shí)譯者可以借助大數(shù)據(jù)的優(yōu)勢(shì),查詢smile的平行詞找到chuckle,giggle,grin等或通過網(wǎng)絡(luò)向英語母語朋友和高人請(qǐng)教,再根據(jù)人物特點(diǎn)和上下文選擇適當(dāng)譯文。使用翻譯記憶軟件可以讓眾多譯員共享網(wǎng)絡(luò)術(shù)語庫(kù),避免重復(fù)工作,降低翻譯成本,節(jié)省時(shí)間和精力,保持上下文術(shù)語前后一致,從整體上提高了翻譯效率和質(zhì)量。而且谷歌本身作為搜索引擎,為其語料庫(kù)內(nèi)容的充實(shí)和更新提供了便利條件。
(二)局限
大數(shù)據(jù)時(shí)代下的機(jī)器翻譯給人們帶來了諸多便利,但也有其局限性。
一,譯文好壞受到平行語料庫(kù)數(shù)據(jù)大小和領(lǐng)域的制約。由于語言規(guī)則復(fù)雜,樣本信息必須足夠大才能有好的效果。
二,運(yùn)用Trados進(jìn)行翻譯時(shí)極大地依賴于翻譯記憶,若翻譯記憶資源中有誤,翻譯記憶的質(zhì)量和數(shù)量都會(huì)影響譯文準(zhǔn)確度。
三,基于大數(shù)據(jù)的翻譯方法并不涉及規(guī)則,尤其是語法規(guī)則,機(jī)器翻譯不能識(shí)別語法信息,降低了譯文的可理解度。如輸入Ahorsestumblesthathasfourlegs時(shí),谷歌翻譯給出的譯文是“馬絆倒有四條腿”。
四,基于大數(shù)據(jù)的翻譯抑制了譯者的創(chuàng)新思維,譯者只會(huì)搜索而不是自己思考,或許會(huì)有更好的譯文也說不定。
五,在翻譯帶有情感的源語言時(shí),機(jī)器并不能像人那樣發(fā)揮譯者的主體性,給出合適的最符合語境的翻譯,體現(xiàn)不出原文人物內(nèi)心的感情色彩,在描寫人物的心理變化方面明顯不足。
六,機(jī)器翻譯無法處理多義詞。輸入的源語言文本內(nèi)容并不一定能夠百分之百地在語料庫(kù)中匹配到對(duì)應(yīng)的內(nèi)容。
七,機(jī)器不能考慮源語言的文化背景上下文等,不能選擇最恰當(dāng)?shù)淖g法。
盡管已取得巨大進(jìn)步,機(jī)器翻譯也有不足之處。總之,在大數(shù)據(jù)時(shí)代下,計(jì)算機(jī)翻譯工具只是一種輔助工具,最根本的還是要發(fā)揮譯員的主體性作用,在不斷改善翻譯記憶庫(kù)中所儲(chǔ)譯文質(zhì)量和數(shù)量情況下,機(jī)譯結(jié)合人譯,才能更好地做好翻譯工作。
相信大家都知道打鐵還需自身硬,我們要鞏固好自身的大數(shù)據(jù)技術(shù),才能更好的應(yīng)用在產(chǎn)品中并不斷的優(yōu)化完善,改善我們的生活。更多大數(shù)據(jù)與人工智能的相關(guān)學(xué)習(xí)資訊關(guān)注公眾號(hào)成都科多大數(shù)據(jù)即可免費(fèi)獲取。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來了!宇樹科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉(cāng)中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來iPhone 時(shí)刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 9 “國(guó)產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗(yàn)
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





