国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

響鈴:AI翻譯引進(jìn)NMT技術(shù),就能精準(zhǔn)識(shí)別“語境”嗎?

2018-06-08 10:52:41   來源:科技向令說  作者:曾響鈴 

摘要:AI翻譯作為垂直搜索產(chǎn)品,因其明朗的落地應(yīng)用場(chǎng)景而備受巨頭們關(guān)注。

《圣經(jīng).舊約》里記載著這樣一段故事:


當(dāng)時(shí)人類聯(lián)合起來興建希望能通往天堂的高塔,為了阻止人類的計(jì)劃,上帝讓人類說不同語言,使人類相互之間不能溝通,計(jì)劃因此失敗,人類自此各散東西。


巴別塔典故,為世上出現(xiàn)不同語言和種族提供了解釋。盡管互聯(lián)網(wǎng)的出現(xiàn),讓“地球村”的夢(mèng)想在地理空間上不再是遙不可及,但語言理解與文化背景成為了全球溝通最大的障礙,又生生的讓夢(mèng)想變得骨感起來。


好在,各大搜索引擎都推出了AI翻譯。


1、AI翻譯這條賽道上,巨頭們都繞不過的“坎”


AI翻譯作為垂直搜索產(chǎn)品,因其明朗的落地應(yīng)用場(chǎng)景而備受巨頭們關(guān)注。


2016年,GNMT技術(shù)(谷歌的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),模仿人腦的神經(jīng)思考模式)全面布局于谷歌翻譯系統(tǒng)中,隨后,谷歌聲稱其AI翻譯的譯文質(zhì)量誤差降低了55%-85%,并且將此技術(shù)廣泛應(yīng)用于網(wǎng)頁翻譯與手機(jī)應(yīng)用。


國(guó)內(nèi),百度當(dāng)時(shí)已經(jīng)研究出了可應(yīng)用的SMT技術(shù)(統(tǒng)計(jì)機(jī)器翻譯),但得知NMT的橫空出世之后,便迅速調(diào)轉(zhuǎn)方向轉(zhuǎn)而研發(fā)NMT技術(shù),于是就有了BNMT應(yīng)用于百度翻譯。盡管初時(shí)的百度翻譯速度很慢,但是,百度當(dāng)時(shí)反應(yīng)也佐證NMT的價(jià)值性。


搜狗、阿里、騰訊等公司也都有部署NMT領(lǐng)域,推出多款基于神經(jīng)網(wǎng)絡(luò)的在線翻譯和手機(jī)應(yīng)用,在智能翻譯領(lǐng)域持續(xù)發(fā)力。360搜索自占據(jù)國(guó)內(nèi)搜索引擎行業(yè)二哥的位置后,同樣專注在AI領(lǐng)域與其他巨頭角力,上線了基于NMT的360翻譯,以期與去年上線的360英文搜索“雙劍合璧”。


但是我們會(huì)發(fā)現(xiàn),不論是谷歌還是BAT,其智能翻譯從未能聲稱能替代人工翻譯,因?yàn)榉g還必須考慮到到使用者的情感及文化背景。從2016年起至今的兩年時(shí)間里,對(duì)海量語料的深度學(xué)習(xí)逐漸成為AI開發(fā)的必修課,也成了巨頭們布局AI翻譯繞不過的“坎”。


正是在這樣的背景下,360翻譯的深度學(xué)習(xí)調(diào)度平臺(tái)卯足了勁,在深層技術(shù)和語料挖掘上下苦功夫。除了發(fā)揮360搜索在新聞資訊方面的既有優(yōu)勢(shì)外,360的英文搜索還與微軟旗下的搜索引擎Bing開展技術(shù)合作,從而使得其AI翻譯背后坐擁海量中英網(wǎng)絡(luò)語料,讓其在理解語境方面更顯地道。另外,360翻譯采用的也是獨(dú)家研發(fā)的360NMT技術(shù)。


但這依然還只是個(gè)開始。


2、搜索平臺(tái)不約而同發(fā)力NMT,為的是哪般?


19.jpg


不論是國(guó)外的谷歌,還是國(guó)內(nèi)的搜索巨頭百度、搜狗、360等,均把NMT作為AI翻譯的標(biāo)配,翻譯集中的領(lǐng)域在中英互譯上,這是一個(gè)很有趣的現(xiàn)象。AI翻譯真的是塊肥肉嗎?惹得誰也不愿意掉隊(duì)。


據(jù)統(tǒng)計(jì)表明,全球一共有73個(gè)國(guó)家,超10億人以英語為官方語言,而漢語則是世界使用人數(shù)最多的語言,因此,中英互譯本身的用戶基數(shù)市場(chǎng)就能引起巨頭們足夠的注意力了。為什么要發(fā)力NMT,這得從AI翻譯人類語言的方式說起,包含三種:第一,基于規(guī)則的機(jī)器翻譯方法;第二,基于實(shí)例的機(jī)器翻譯方法;第三,基于統(tǒng)計(jì)的翻譯方法。SMT與NMT都屬于第三種,從語料自動(dòng)學(xué)習(xí)翻譯模型,結(jié)合大數(shù)據(jù)通過評(píng)分輸出翻譯結(jié)果。


但是,SMT與NMT存在著顯著的差距。SMT采用的模式是通過平行語料進(jìn)行統(tǒng)計(jì)分析,翻譯的準(zhǔn)確性則與語料的豐富度呈明顯的正相關(guān),但是存在著翻譯結(jié)果太過零散,片面生硬,語法語義混亂的劣勢(shì)。而模仿人類神經(jīng)網(wǎng)絡(luò)構(gòu)建模型,NMT是以一個(gè)句子為基本的處理單元,好處在于翻譯過程中有著更好的語感,能降低SMT翻譯的關(guān)于“形態(tài)、句法、詞序”等方面出錯(cuò)的概率。因此,NMT在技術(shù)上恰巧可以有效彌補(bǔ)SMT的缺陷。而隨著語料不斷地加碼,AI翻譯的準(zhǔn)確度也就高得多。


3、AI翻譯引進(jìn)NMT技術(shù),就能精準(zhǔn)識(shí)別“語境”嗎?


搜狗同傳翻譯在某次國(guó)際性會(huì)議上,聲稱其神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)已達(dá)臨界點(diǎn),并在進(jìn)行大規(guī)模商用推廣。只是,搜狗的同傳還是在國(guó)際會(huì)議上出過爭(zhēng)議,結(jié)果不盡如人意。即便在正式的場(chǎng)合能夠應(yīng)對(duì)自如的搜狗,在非正式場(chǎng)合會(huì)是怎樣一種情況呢?很多時(shí)候的中英交流多以口語化形式出現(xiàn),對(duì)“語境”的理解遠(yuǎn)比“語法和詞匯”難得多。下文我們將就幾組語句進(jìn)行討論(以下從搜狗、360搜索、百度以及谷歌四大平臺(tái)進(jìn)行對(duì)比)。


第一組:獻(xiàn)上我的膝蓋。看看,最近這句網(wǎng)絡(luò)常用語各翻譯平臺(tái)的水平


谷歌:Offer my knee。


360:express my admiration。


百度:Offer my knees。


搜狗:Give me my knee。


測(cè)試結(jié)果是搜狗、百度、谷歌均傾向于單詞表面意思的翻譯,并未能結(jié)合具體的文化背景,而360對(duì)于該網(wǎng)絡(luò)用語的解釋就地道的多。


第二組:詩詞,選自杜甫的《登高》。因其詩中主要是以諸多意象組成的意境,看翻譯能否反饋這種情感。


《登高》原文摘選:


風(fēng)急天高猿嘯哀,渚清沙白鳥飛回。


英語譯文:




有趣的是將各自翻譯的英文譯成中文時(shí),沒有一個(gè)平臺(tái)能還原。而在詩歌的中譯英中360能夠結(jié)合“語境”處理詩中的意向要素,搜狗翻譯表達(dá)出了“悲愴”的情感,而百度翻譯和谷歌翻譯則完全是從字面上進(jìn)行翻譯,破壞了詩的美好。


第三組:新聞,選自紅網(wǎng)。語言簡(jiǎn)練正式,但涉及的元素較多,對(duì)語法的要求性比較高。


原文:據(jù)長(zhǎng)沙市住房和城鄉(xiāng)建設(shè)委員會(huì)網(wǎng)站顯示,2018年5月23日,長(zhǎng)沙共計(jì)有兩個(gè)項(xiàng)目獲批預(yù)售證,均位于雨花區(qū),分別為五礦萬境藍(lán)山和創(chuàng)元時(shí)代。


譯文:




同一段新聞,出現(xiàn)了四種不同的譯法。同一語句中各家強(qiáng)調(diào)的點(diǎn)不一樣,譬如首句的“長(zhǎng)沙市住房和城鄉(xiāng)建設(shè)委員會(huì)”,360的翻譯結(jié)果更顯得專業(yè)并符合慣常表述,“長(zhǎng)沙市”只是作為補(bǔ)充詞出現(xiàn),而搜狗、百度和谷歌的翻譯中,“長(zhǎng)沙市”則是作為硬性的地名出現(xiàn)。尤為值得注意的是,根據(jù)語境,“五礦萬境藍(lán)山”和“創(chuàng)元時(shí)代”都是樓盤名字,應(yīng)當(dāng)由漢語拼音直譯,只有360識(shí)別到這一點(diǎn),搜狗、百度和谷歌三家都在“礦”、“藍(lán)山”、“創(chuàng)元”、“時(shí)代”等字眼上糾結(jié)。


從這三組中,我們能發(fā)現(xiàn)360偏好于基于“語境”的邏輯進(jìn)行分詞,雖然也有做的不到位的,像針對(duì)詩詞這樣復(fù)雜的情感語句就無法準(zhǔn)確傳達(dá),但是在“流行語”優(yōu)勢(shì)明顯;而谷歌和百度基本上是基于詞組進(jìn)行斷句,因此,翻譯也是一個(gè)詞一個(gè)詞,尤其是對(duì)古詩詞的理解,谷歌就顯得比較憂愁了。


因此,AI翻譯的問題主要反映在三大方面:第一,機(jī)器翻譯難以應(yīng)對(duì)語言規(guī)則不統(tǒng)一的口語;第二,AI翻譯難以結(jié)合文化語境進(jìn)行理解,解析不出深層次的情感;第三,針對(duì)較長(zhǎng)的段落,以及較為復(fù)雜的語境,往往會(huì)出現(xiàn)語法問題多,語句出錯(cuò)率高的毛病。


4、AI翻譯要“地道”,技術(shù)倒不是關(guān)鍵


翻譯界老將何恩培曾講:“機(jī)器翻譯一直被公認(rèn)為人工智能領(lǐng)域最難的課題之一。而且語言背后的多元文化和復(fù)雜社會(huì)屬性,注定了語言規(guī)則不可能規(guī)律化”。但是,中國(guó)有句老話:勤能補(bǔ)拙。對(duì)于AI翻譯而言,最難的不是技術(shù),而是“語境”理解,而AI翻譯能力的級(jí)別高低又體現(xiàn)在這,集中體現(xiàn)了平臺(tái)喂養(yǎng)語料的資源狀況。AI翻譯能否“地道”,取決于以下幾點(diǎn)。


1、訓(xùn)練數(shù)據(jù)庫的內(nèi)容整體優(yōu)質(zhì)程度


這影響到翻譯準(zhǔn)確程度,取決于信息資源的整合能力。不論是BAT,還是360、搜狗、有道等,都在注重內(nèi)容生態(tài)建設(shè),搜狗有了騰訊微信入口搜索,360搶占了安全領(lǐng)域的數(shù)據(jù)來源。但是,這不可能是一個(gè)完全開放的體系,沒有哪一家能夠整合整個(gè)互聯(lián)網(wǎng)的資源,各平臺(tái)訓(xùn)練數(shù)據(jù)庫各有側(cè)重,AI翻譯特色也不盡相同,例如360翻譯側(cè)重于地道的口語與流行語,百度翻譯則顯得大而全。


2、開放平等的中外數(shù)據(jù)交流,或可加強(qiáng)AI的深度學(xué)習(xí)


國(guó)內(nèi)對(duì)標(biāo)競(jìng)品之間的合作相對(duì)較難,但中外數(shù)據(jù)交流卻是最好的互補(bǔ)。因此,百度上線過英文搜索產(chǎn)品,而360與微軟Bing有過技術(shù)合作。此外,有了國(guó)界互譯也變得更有意義。因此,中外數(shù)據(jù)合作,或許對(duì)于文化背景的數(shù)據(jù)積淀有很好的補(bǔ)充,也是擴(kuò)充深度學(xué)習(xí)的語料最直接的方式。


3、需要準(zhǔn)備大量的網(wǎng)絡(luò)語及口語語料


除了詩詞蘊(yùn)含深厚文化底蘊(yùn)外,網(wǎng)絡(luò)語和口語是與一個(gè)地域的文化最為接近的語言形態(tài),時(shí)下搜索引擎從被動(dòng)搜索向主動(dòng)的、基于用戶興趣的內(nèi)容推薦引擎轉(zhuǎn)型,這對(duì)于構(gòu)建口語語料訓(xùn)練模型倒是一個(gè)不錯(cuò)的嘗試。


雖然說,AI翻譯能夠精準(zhǔn)識(shí)別“語境”是需要很長(zhǎng)一段路要走,但是技術(shù)已經(jīng)在進(jìn)步,360翻譯能夠開始揣摩語句背后的情感與心思,對(duì)于日常交流來說是一個(gè)很好的開端。或許,我們將因此離“地球村”的夢(mèng)想更進(jìn)一步!


猜你喜歡
原創(chuàng)

突發(fā)爆雷!255億家居龍頭實(shí)控人被留置

AI家居

255億家居龍頭突發(fā)爆雷,居然之家實(shí)控人被留置

2025-04-18

半導(dǎo)體制造AI大腦:從CIM1.0到CIM 3.0的中國(guó)式躍遷

AI創(chuàng)新創(chuàng)業(yè)

從 ChatGPT到DeepSeek,大模型的崛起標(biāo)志著 AI 從通用智能邁向行業(yè)深耕的分水嶺。

2025-04-17

AI偽造泛濫下 親筆簽以動(dòng)態(tài)生物特征破解電子簽名安全困局

AI創(chuàng)新創(chuàng)業(yè)

今年以來,什么最熱門?AI(人工智能)等智能技術(shù)可能是最好的答案。

2025-03-24

原創(chuàng)

中國(guó)手機(jī),在海外“殺瘋”了

手機(jī)AI5G

5G-A、衛(wèi)星直連......國(guó)產(chǎn)手機(jī)“驚艷”歐洲!

2025-03-06

原創(chuàng)

字節(jié)跳動(dòng),在中國(guó)搞出“ChatGPT”?

AI字節(jié)跳動(dòng)ChatGPT

字節(jié)跳動(dòng),再次激活A(yù)I賽道?

2024-12-25

業(yè)績(jī)穩(wěn)中有升、基本面良好,叮當(dāng)健康是否值得長(zhǎng)期看好?

上市公司叮當(dāng)健康

近期,互聯(lián)網(wǎng)醫(yī)藥醫(yī)療行業(yè)整體板塊表現(xiàn)亮眼,其中叮當(dāng)健康(09886.HK)因展現(xiàn)出良好的發(fā)展態(tài)勢(shì),基...

2025-02-17

智駕感知層國(guó)產(chǎn)龍頭 豪恩汽電獲券商“增持”評(píng)級(jí)

上市公司豪恩汽電

我們認(rèn)為公司在視覺傳感器市場(chǎng)市占率領(lǐng)先,自主、海外客戶收入有望快速增長(zhǎng),伴隨智能駕駛滲透率提升,公司...

2025-02-17

進(jìn)口奶粉品牌有哪些?海普諾凱荷致白金版實(shí)力出圈

大消費(fèi)海普諾凱

在這樣的市場(chǎng)環(huán)境下,“高端奶粉”成為家長(zhǎng)們心目中的理想之選。家長(zhǎng)們希望通過選擇高端奶粉,借助其科學(xué)的...

2025-02-17

微眾銀行微業(yè)貸科創(chuàng)企業(yè)貸款入駐上海市企業(yè)服務(wù)云平臺(tái)

金融科技微眾銀行

近日,上海市企業(yè)服務(wù)云迎來首位數(shù)字銀行新伙伴,微眾銀行純線上、無抵押、秒到賬的微業(yè)貸科創(chuàng)企業(yè)貸款產(chǎn)品...

2025-02-17

泰康鑫享世家(分紅型)成為家庭長(zhǎng)期資產(chǎn)的“壓艙石”

金融科技泰康鑫享世家

長(zhǎng)壽時(shí)代到來,隨著醫(yī)療技術(shù)的進(jìn)步,人們的壽命普遍延長(zhǎng),可退休后的日子變長(zhǎng)了,養(yǎng)老的經(jīng)濟(jì)壓力也跟著增大...

2025-02-17

AI賦能,煥新升級(jí) | 圣方醫(yī)藥研發(fā)正式更名為“太美智研醫(yī)藥”

醫(yī)療健康太美智研醫(yī)藥

AI引領(lǐng)的新一輪科技革命,正以前所未有的力量重塑世界,為各行各業(yè)注入澎湃動(dòng)能與無限可能。

2025-02-17

重構(gòu)兒童外科未來:上海兒童醫(yī)學(xué)中心單孔機(jī)器人手術(shù)的全球創(chuàng)新實(shí)踐

醫(yī)療健康術(shù)銳?單孔機(jī)器人

在微創(chuàng)外科領(lǐng)域,單孔機(jī)器人手術(shù)憑借創(chuàng)傷小、恢復(fù)快、精準(zhǔn)度高的獨(dú)特優(yōu)勢(shì),逐漸成為全球頂級(jí)醫(yī)療機(jī)構(gòu)的“技...

2025-02-17

叮當(dāng)快藥攜手?jǐn)?shù)十家原研藥企發(fā)起“原研藥保供聯(lián)盟”,致力滿足患者多元用藥需求

醫(yī)療健康叮當(dāng)快藥

近日,即時(shí)健康到家服務(wù)企業(yè)叮當(dāng)快藥宣布與數(shù)十家原研藥企加強(qiáng)深度合作,共同成立“原研藥保供聯(lián)盟”,開通...

2025-02-17

iPhone SE4重構(gòu)產(chǎn)業(yè)鏈價(jià)值,消費(fèi)電子龍頭迎來新高

創(chuàng)新創(chuàng)業(yè)iPhone SE4

2025年2月19日,蘋果將迎來年度首場(chǎng)新品發(fā)布,iPhone SE4 成為最大亮點(diǎn)。

2025-02-17

投資家網(wǎng)(www.51baobao.cn)是國(guó)內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國(guó)市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長(zhǎng)按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。

分化浪潮中的堅(jiān)守與突破 | 第19屆中國(guó)投資年會(huì),即將啟幕

分化浪潮中的堅(jiān)守與突破 | 第19屆中國(guó)投資年會(huì),即將啟幕

在時(shí)代的浩渺長(zhǎng)河中,“分化”宛如一條隱匿的脈絡(luò),貫穿于萬物的生長(zhǎng)、發(fā)展與變遷。從生命的進(jìn)化到文明的演...

產(chǎn)業(yè)與技術(shù)雙向奔赴,具身智能產(chǎn)業(yè)供需交流會(huì)成功舉辦!

產(chǎn)業(yè)與技術(shù)雙向奔赴,具身智能產(chǎn)業(yè)供需交流會(huì)成功舉辦!

具身智能產(chǎn)業(yè)場(chǎng)景探索正當(dāng)時(shí)!

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)將盛大啟幕

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)將盛大啟幕

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)于2025年4月9日在匈牙利布達(dá)佩斯盛大啟幕。

雕刻耐心|第18屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)在滬召開

雕刻耐心|第18屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)在滬召開

“中國(guó)投資年會(huì)”作為私募股權(quán)行業(yè)的年度盛會(huì),已成功舉辦了18屆,吸引了全國(guó)VC/PE領(lǐng)域從業(yè)者的廣泛...

主站蜘蛛池模板: 精品在线观看免费 | 99精品视频在线在线视频观看 | 99久久精品国产自免费 | 久久怡红院亚欧成人影院 | 日本乱人伦毛片 | 精品国产高清在线看国产 | 真实国产精品视频国产网 | 亚洲性网| 久久成人免费观看全部免费 | 国产成人精品福利网站人 | 国产一级做a爰片久久毛片99 | 草草影院ccyy国产日本欧美 | 2020精品极品国产色在线观看 | 国产不卡a | 欧美色性视频 | 精品欧美一区二区精品久久 | 欧美特黄一区二区三区 | 99国产高清久久久久久网站 | 国产精品爽爽va在线观看无码 | 久久国产欧美日韩精品 | 高清不卡日本v在线二区 | 精品久久久久久综合网 | 国产在线免 | 国产99视频精品免费视频7 | 欧美日韩一二区 | 亚洲精品一区二区四季 | 日本免费久久 | 91精品专区 | 欧美三级成版人版在线观看 | 一级国产视频 | 亚洲国产日韩成人综合天堂 | 波多野结衣视频在线观看 | japanese 色系 tube日本 | 欧美大片a一级毛片视频 | 中文字幕无线码中文字幕网站 | 精品国产一区二区三区久久 | 国产高清免费在线 | 国产喷水女王在线播放 | 九九热视频精品在线观看 | 网禁呦萝资源网站在线观看 | 日本毛片免费看 |