本文記錄了語言橋從2000年成立至今的技術(shù)發(fā)展歷程,從CAT工具的應(yīng)用,到自研機(jī)器翻譯系統(tǒng)的突破,再到大語言模型時(shí)代的轉(zhuǎn)型探索。作者以親歷者的視角,分享了在AI技術(shù)浪潮中,一家傳統(tǒng)語言服務(wù)企業(yè)如何通過持續(xù)的技術(shù)創(chuàng)新和"AI系統(tǒng)+專家系統(tǒng)"的理念實(shí)現(xiàn)轉(zhuǎn)型升級(jí)的經(jīng)驗(yàn)。文章為語言服務(wù)行業(yè)在AI時(shí)代的發(fā)展提供了有益的思考。
2017年冬,我去了一趟沈陽,約見了東北大學(xué)的朱靖波老師,他也是小牛翻譯的創(chuàng)始人,朱老師為人比較爽快,交談之中得知我們兩個(gè)竟然是同年出生,又是本家都姓朱,朱老師就很爽快地請(qǐng)我吃上了東北菜。飯桌上,我們約定2018年春天在成都召開一次機(jī)器翻譯論壇。朱老師是機(jī)器翻譯領(lǐng)域的專家,在業(yè)內(nèi)人脈比較廣,說干就干,2018年5月,成都機(jī)器翻譯論壇如期舉行,竟然從兩岸三地來了三四十位自然語言處理領(lǐng)域的專家和學(xué)者,很多人在行業(yè)里面都是鼎鼎有名的。
過了幾年之后,再回想此事,才明白那是因?yàn)闄C(jī)器翻譯的春天到了。2017 年由 Google Brain 等研究團(tuán)隊(duì)(Vaswani et al.)提出的一篇重要論文《Attention Is All You Need》,闡述了一種全新的序列到序列(sequence-to-sequence)模型架構(gòu),也就是后來廣泛使用的 Transformer。
它最大的創(chuàng)新點(diǎn)在于徹底拋棄了以往在自然語言處理(NLP)中常用的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN),只使用基于注意力機(jī)制(Attention Mechanism)的模塊來完成建模。這篇論文之所以重要,在于它極大地改變了之后的 NLP算法設(shè)計(jì)思路,并在各類語言任務(wù)上取得了極好的效果。
可以說,這是一篇跨時(shí)代的文章,成為當(dāng)今自然語言處理(NLP)的基石,催生了BERT、GPT、T5等劃時(shí)代模型,并逐步擴(kuò)展到計(jì)算機(jī)視覺、語音、多模態(tài)等領(lǐng)域。這篇文章就如同那星星之火,點(diǎn)亮了今天各種大模型的燎原之勢。
語言橋是2000年成立的,主要為客戶提供翻譯服務(wù),所以我日常就比較關(guān)注翻譯技術(shù)的發(fā)展,從各類電子詞典,到后來的各種CAT系統(tǒng),應(yīng)該說各類軟件都試用過。2005年左右,Trados在國內(nèi)翻譯圈開始普及,它是一款專業(yè)的計(jì)算機(jī)輔助翻譯軟件(CAT,Computer-Aided Translation),由原先的 Trados 公司開發(fā)。其中的一個(gè)主要功能是翻譯記憶庫(Translation Memory,TM),即在翻譯過程中,軟件會(huì)將已經(jīng)翻譯過的內(nèi)容(原文與譯文)存儲(chǔ)到數(shù)據(jù)庫中,下一次遇到相同或相似的句子時(shí),會(huì)自動(dòng)匹配并提供建議,提高翻譯效率與一致性。
對(duì)于專業(yè)譯員來說, CAT工具可以極大地提高工作效率和質(zhì)量,所以類似Trados的CAT工具在譯員中間比較常見。但由于Trados定價(jià)較高,且操作比較復(fù)雜,我們?cè)?015年著手開發(fā)自己的CAT系統(tǒng),當(dāng)時(shí)組建了一支30多人的技術(shù)團(tuán)隊(duì),大概用了兩年多的時(shí)間,開發(fā)了語言橋的LanCAT平臺(tái),到2017年底,LanCAT已經(jīng)在語言橋內(nèi)部全面部署和使用了。
在此之前,大家對(duì)機(jī)器翻譯(MT)了解并不多,因?yàn)椴还苁腔谝?guī)則的機(jī)器翻譯系統(tǒng)(RBMT)和還是基于統(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)(SMT)的翻譯質(zhì)量都很差,很難被譯員接受,大家也就很少關(guān)注。直到2016年,Google、微軟、Facebook等公司開始將 RNN+Attention或類似的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到在線翻譯服務(wù)中,讓大眾體驗(yàn)到NMT在翻譯質(zhì)量與流暢度方面顯著優(yōu)于傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯(SMT)。
2017年,Google團(tuán)隊(duì)推出了完全基于注意力(Attention)機(jī)制的 Transformer 模型,徹底拋棄了 RNN,Transformer在翻譯任務(wù)上的表現(xiàn)更好、訓(xùn)練速度更快。正是因?yàn)榉g質(zhì)量的明顯提升,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)才開始被廣泛提及和應(yīng)用。
2018年成都會(huì)議之后,我認(rèn)識(shí)到技術(shù)的發(fā)展勢不可擋,并開始加大對(duì)技術(shù)的投入,一方面招兵買馬,把技術(shù)團(tuán)隊(duì)從原來的30多人,擴(kuò)大至50多人,另一方面加強(qiáng)和科研機(jī)構(gòu)的合作。2019年我們和電子科技大學(xué)閆明明老師的團(tuán)隊(duì)簽訂了一個(gè)橫向合作項(xiàng)目即《基于模糊類聚的神經(jīng)機(jī)器翻譯算法系統(tǒng)》。
2020年,我們又和西湖大學(xué)張?jiān)览蠋煹膱F(tuán)隊(duì)合作簽訂了三年的技術(shù)研發(fā)委托協(xié)議,旨在打造我們自己的機(jī)器翻譯系統(tǒng),直到2021年底,語言橋推出了自己的機(jī)翻系統(tǒng)LanMT,并于2022年參加了WMT國際機(jī)器翻譯大賽,在訓(xùn)練數(shù)據(jù)少、訓(xùn)練難度高的8個(gè)小語種方向,取得了所有參賽隊(duì)伍中的最好成績,榮獲2項(xiàng)冠軍和8項(xiàng)亞軍的優(yōu)異成績。
為了提升LanMT在主流語種(中英-英中)方面的表現(xiàn),LanMT機(jī)器翻譯團(tuán)隊(duì)提升了數(shù)據(jù)質(zhì)量并優(yōu)化了訓(xùn)練方法,在2023年WMT的比賽中,斬獲英中賽道第一名和中英賽道第二名的好成績。
至此,我們把LanMT集成到LanCAT中,并在公司內(nèi)部廣泛使用,得到眾多譯員的一致好評(píng)?;诠咀匝械腖anCAT和LanMT,我們又先后開發(fā)了LanOCR、MH(Machine Human人機(jī)共譯系統(tǒng))、Doc-Trans(文檔快譯系統(tǒng))、PBLT(Project Based Language Training翻譯教學(xué)實(shí)訓(xùn)系統(tǒng))、以及Dtranx AI Dubbing、AI Live等工具和平臺(tái)。并針對(duì)語言橋的客戶,推出了SaaS和私有化部署服務(wù)。從2015年算起,我們?cè)诩夹g(shù)上的投入已累計(jì)上億元,目前已經(jīng)有不少行業(yè)客戶訂閱或者部署了語言橋的各類系統(tǒng),我們?cè)诩夹g(shù)上的投入也算得到了內(nèi)部和外部的認(rèn)可,并取得了一定的回報(bào)。
LanCAT
LanMT
DTRANX AI
PBLT
文檔翻譯
LanOCR
在LanMT的立項(xiàng)和研發(fā)過程中,充分利用了語言橋的優(yōu)勢,一方面是我們有大量的高質(zhì)量的語料積累,另外一方面是我們有將近500人的專職翻譯和審校團(tuán)隊(duì),技術(shù)團(tuán)隊(duì)和審校團(tuán)隊(duì)密切合作,形成了一個(gè)閉環(huán),即機(jī)器和專家協(xié)作的閉環(huán)(Expert-in-the-loop),這樣可以做到人機(jī)交互的及時(shí)反饋,技術(shù)團(tuán)隊(duì)可以快速優(yōu)化數(shù)據(jù)和訓(xùn)練方法,我想這也是為什么我們能在三年之內(nèi)推出自己的機(jī)翻系統(tǒng),并取得優(yōu)異成績的原因之一吧。
另外,還有一個(gè)來自于業(yè)內(nèi)的觀點(diǎn)值得一提,在萊博智2023年度《機(jī)器翻譯報(bào)告》中提到,“MT 這項(xiàng)技術(shù)在2022 年期間沒有顯著改進(jìn),到2023年初,主流引擎之間的差距變得微乎其微。假設(shè)NMT 范式繼續(xù)占主導(dǎo)地位,并且 MT 提供商繼續(xù)以類似的速度進(jìn)行投資。在這種情況下,盡管不同語言對(duì)和領(lǐng)域之間可能會(huì)存在一些差異,但我們預(yù)計(jì) MT引擎的性能最終將在本年內(nèi)趨于一致。”,看到這里,我想這也是為什么語言橋的機(jī)翻引擎LanMT能在這個(gè)時(shí)間點(diǎn)上取得優(yōu)異成績的另外一個(gè)原因吧。
從2016年到2022年,NMT的質(zhì)量迅速提升,但也遇到進(jìn)一步提升的瓶頸,NMT范式的發(fā)展是否達(dá)到了平臺(tái)期?而大語言模型(Large Language Models) 在 2022 年取得了重大進(jìn)展,特別是Open AI在2022年11月30日推出的ChatGPT后,迅速獲得廣泛關(guān)注,成為主流大眾認(rèn)知的里程碑事件。
記得是2023年初的春節(jié)期間,ChatGPT在國內(nèi)大火(盡管在國內(nèi)大部分人還用不上),好像世間出現(xiàn)了一個(gè)新物種,大家都用新奇的眼光打量著它,拿來各種問題去問它,甚至是故意刁難它,它好像是個(gè)無所不知的萬能博士,不急不慢的回答著來自世界各地用戶提出的各種各樣的問題。第一批用戶急不可耐地把自己的體驗(yàn)分享到互聯(lián)網(wǎng)平臺(tái)上,又有更多的用戶涌進(jìn)來,根據(jù)公開報(bào)道,ChatGPT僅用了兩個(gè)月的時(shí)間就達(dá)到了月活躍用戶上億的規(guī)模。
記得我也在第一時(shí)間分享了自己的使用經(jīng)驗(yàn),并在語言橋之聲公眾號(hào)上發(fā)表了兩篇文章,一篇是《和ChatGPT談翻譯:技術(shù)、職業(yè)及行業(yè)發(fā)展》,另外一篇是《和ChatGPT談搜索:搜索、問答系統(tǒng)及聊天機(jī)器人》,兩篇文章都收到了廣泛的閱讀和關(guān)注。
如果說神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)是在原來基于規(guī)則的機(jī)器翻譯(RBMT)和基于統(tǒng)計(jì)的機(jī)器翻譯(SMT)基礎(chǔ)上,取得了很大的進(jìn)展,但也僅僅是在學(xué)術(shù)圈和翻譯圈大家才有廣泛的認(rèn)知,普通大眾知道的并不多,使用的則更少。但ChatGPT的橫空出世,打破了人工智能的研究及成果僅在學(xué)術(shù)圈和相關(guān)行業(yè)圈傳播的界限,打開了普通大眾對(duì)人工智能的期待和幻想,越來越多的人開始相信人工智能,也開始把它作為一種工具來使用。
語言橋的LanMT成熟以后,我們就開始在內(nèi)部系統(tǒng)上部署并優(yōu)化了原來的工作流程,提出來MT+PE的概念,即機(jī)器翻譯(Machine Translation)+人工審校(Post-editing)。但后來,隨著大模型翻譯質(zhì)量的提升,我們又提出新的模式,即打造兩個(gè)系統(tǒng):AI系統(tǒng)+專家系統(tǒng)。我們用“讓AI系統(tǒng)更智能,讓專家系統(tǒng)更可靠”的理念來指導(dǎo)我們的技術(shù)研發(fā)方向以及專家的工作目標(biāo)。
AI系統(tǒng)包括CAT,MT,OCR,LLMs等各種工具和平臺(tái),我們把這些工具有效整合,并根據(jù)不同的應(yīng)用場景對(duì)工具和模型進(jìn)行調(diào)優(yōu)。專家系統(tǒng)按不同的領(lǐng)域和專業(yè),不同的語種和背景進(jìn)行分類。專家要懂得使用和駕馭AI系統(tǒng),AI系統(tǒng)借助專家系統(tǒng)不斷迭代升級(jí),專家系統(tǒng)借助AI系統(tǒng)不斷提高效率和能力。
AI系統(tǒng)和專家系統(tǒng)相互依存、協(xié)同工作,形成公司核心競爭力。憑借先進(jìn)的理念,以及扎實(shí)的基礎(chǔ),語言橋的業(yè)務(wù)并未受到技術(shù)引發(fā)的太大的沖擊和影響,我們的專家隊(duì)伍不僅沒有減少,反而隨著業(yè)務(wù)的發(fā)展還在不斷增加。
每當(dāng)我在外參加活動(dòng),見到一些新朋友,在介紹自己的時(shí)候,我說我是做翻譯的,總會(huì)有些朋友上來就問,現(xiàn)在機(jī)器都翻譯的挺好的,還需要你們專業(yè)的人工翻譯嗎?我對(duì)朋友們說,大模型來了,我們是最早被洪水沖到河里的一撥人,如果我們隨波逐流,而不奮力搏擊,那很快就會(huì)被沖到大海里,等到了大海里面,你就再也找不到自己了。
我還會(huì)耐心的給朋友們解釋語言的多樣性和場景的復(fù)雜性。我認(rèn)為,翻譯還是一個(gè)非常復(fù)雜的工作,不管技術(shù)如何進(jìn)步,也很難達(dá)到完全取代人的地步,為了更好的完成任務(wù),人機(jī)協(xié)同還會(huì)長期存在。
的確,對(duì)于一般性質(zhì)的、日常交流的語言,機(jī)器已經(jīng)翻譯的很好了,你能明白機(jī)器翻譯所表達(dá)的意思。但對(duì)于質(zhì)量要求較高的資料,如法律文書、合同、規(guī)范、標(biāo)準(zhǔn)、專利、產(chǎn)品說明書、營銷材料等,若僅用機(jī)器翻譯,客戶是無法放心去使用或者對(duì)外發(fā)布的。
ChatGPT問世之后,大家的關(guān)注點(diǎn)開始從NMT轉(zhuǎn)向LLM,技術(shù)公司對(duì) LLM 技術(shù)表現(xiàn)出很濃厚的興趣,并不斷加大投入。尤其是在中國出現(xiàn)了“百模大戰(zhàn)”的局面,呈現(xiàn)出各種“大規(guī)模深度學(xué)習(xí)模型”競相發(fā)展的態(tài)勢,主要表現(xiàn)為科技公司、研究機(jī)構(gòu)等競相推出參數(shù)龐大、計(jì)算需求高的AI模型,以爭奪技術(shù)優(yōu)勢和市場主導(dǎo)地位。
兩年之后,又是在春節(jié)期間,DeepSeek 火速出圈,掀起了一波新的浪潮。DeepSeek在2025年1月20日發(fā)布R1模型后,在短短7天內(nèi)突破了1億用戶,創(chuàng)造了新的記錄。DeepSeek以低成本、高效率、開源等特點(diǎn)出圈,并震驚世界,仿佛是一夜之間,家家戶戶都用上了DeepSeek,極大地推動(dòng)了人工智能技術(shù)在中國的落地和普及。
從ChatGPT到DeepSeek,當(dāng)然中間還有很多大模型,我們的技術(shù)團(tuán)隊(duì)都是在第一時(shí)間跟進(jìn)并評(píng)估其翻譯質(zhì)量,并在必要的時(shí)候,接入我們的LanCAT系統(tǒng),供我們內(nèi)部譯員和外部用戶使用。相比機(jī)器翻譯,大模型在語感和上下文理解方面比較擅長,但時(shí)不時(shí)會(huì)有幻覺出現(xiàn),難以覺察和控制。相比大模型,機(jī)器翻譯反應(yīng)速度快、效率高、不會(huì)有幻覺,并且針對(duì)小語種或特定的專業(yè)領(lǐng)域,比較容易定制化訓(xùn)練。
當(dāng)前,根據(jù)不同的應(yīng)用場景,我們會(huì)采用不同的技術(shù)方案,有用機(jī)器翻譯的,也有用大模型的,也有兩者結(jié)合的。但是不管用什么樣的機(jī)器翻譯或者大模型,都很難達(dá)到精準(zhǔn)翻譯的目的,最終還是需要專家來把關(guān)。對(duì)很多專業(yè)的譯員來說,CAT是工作界面、是文本效率工具(解決了很多文本格式的問題),NMT是翻譯效率工具,LLMs則是問答系統(tǒng)(比google和百度好用太多)。當(dāng)然,也有譯員用NMT做翻譯,然后用LLMs做問答和審校。隨著LLMs技術(shù)的發(fā)展,其質(zhì)量還可能會(huì)進(jìn)一步提升,大家也可能會(huì)直接用LLMs做翻譯,再調(diào)用LLMs的能力做審校。
站在2025的節(jié)點(diǎn)回望,從CAT技術(shù)在國內(nèi)的普遍使用,到今天有NMT和LLMs的加持,技術(shù)的每一次進(jìn)步都在重新定義人機(jī)工作的內(nèi)容和邊界。在技術(shù)浪潮的推動(dòng)下,翻譯行業(yè)正經(jīng)歷前所未有的變革。無論是計(jì)算機(jī)輔助翻譯(CAT),還是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)和大模型(LLM),技術(shù)的進(jìn)步永遠(yuǎn)是雙刃劍:它既帶來了效率的飛躍,也對(duì)人類譯員提出了更高的要求。
未來的翻譯行業(yè),不再是單純依賴機(jī)器或人類,而是“人機(jī)協(xié)同”的深度融合。譯員不再是單純的翻譯者,而是技術(shù)的駕馭者、內(nèi)容的把關(guān)者、文化的橋梁搭建者。技術(shù)可以提供速度和規(guī)模,但只有人類才能賦予語言以溫度和深度。
在新一輪的技術(shù)革命中, 隨著大模型的基礎(chǔ)能力不斷提升,Agent、通用智能、模型上下文協(xié)議(Model Control Protocol, MCP)等概念陸續(xù)出現(xiàn),AI已經(jīng)可以進(jìn)行瀏覽器控制(Browser Use)甚至是電腦控制(Computer Use),可以想象,技術(shù)又將推動(dòng)我們現(xiàn)有的人機(jī)交互模式進(jìn)入全新的時(shí)代,開啟翻譯行業(yè)的新篇章。Translator Agent將超越傳統(tǒng)的機(jī)器翻譯工具,從一個(gè)需要我們主動(dòng)使用的工具,到一個(gè)具備深度學(xué)習(xí)能力的智能翻譯伙伴。
正如我常對(duì)團(tuán)隊(duì)說的那樣:技術(shù)的洪流不可阻擋,但我們可以選擇如何游泳。與其隨波逐流,不如主動(dòng)擁抱變化,用技術(shù)賦能專業(yè),用專業(yè)反哺技術(shù)。未來的翻譯行業(yè),屬于那些既懂技術(shù)又懂語言、既懂專業(yè)又懂文化的人。而我們,正在用“AI系統(tǒng)+專家系統(tǒng)”的理念,為這個(gè)行業(yè)探索一條可持續(xù)發(fā)展的道路。
文 / 語言橋集團(tuán)董事長 朱憲超
本文源自語言橋集團(tuán)官方公眾號(hào)“語言橋之聲”,文中提及相關(guān)鏈接及技術(shù)產(chǎn)品(www.dtranx.com)還請(qǐng)移步公眾號(hào)獲取。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )