簡明語言(Plain Language Summaries)并非新概念,而且其應(yīng)用場景正逐漸增加。簡明語音有時(shí)稱之為簡明寫作或通俗表達(dá),簡明語言通常指讀者一讀就能理解的表達(dá)方式。
自2006年聯(lián)合國通過《聯(lián)合國殘疾人權(quán)利公約》(CRPD)以來,已有160多個(gè)成員國成功簽署,成為聯(lián)合國最成功的條約之一。作為CRPD的一部分,第2條明確將簡明語言列為可能需要采取的交流方式之一,以使信息更易于理解。
用通俗語言寫作的主要原因是確保讀者容易理解,而且也有利于提升讀者體驗(yàn)、觸達(dá)新受眾,以及優(yōu)化搜索引擎或翻譯流程。實(shí)際上,國際標(biāo)準(zhǔn)化組織已于2023年6月發(fā)布了該領(lǐng)域的第一個(gè)標(biāo)準(zhǔn)《ISO 24495-1:2023 簡明語言—第1部分:基本原則和指南》。
通俗易懂的語言能夠更廣泛地觸及受眾
簡明語言的立足點(diǎn)之一就是科學(xué)交流或研究交流。以前,研究人員通過專業(yè)平臺(tái)交流學(xué)術(shù)成果,比如期刊文章或論壇。而現(xiàn)在,越來越多的研究人員被鼓勵(lì)與更廣泛的受眾(包括非專業(yè)人士)分享他們的發(fā)現(xiàn)。這種推廣可以采取不同的形式(例如信息圖表、視頻等)。但最常見的形式是簡明語言摘要。越來越多的期刊,特別是在健康和科學(xué)領(lǐng)域,鼓勵(lì)研究人員提交研究成果的簡明語言摘要和傳統(tǒng)的科學(xué)摘要,與文章一同呈現(xiàn)(例如,加拿大科學(xué)出版社、泰勒與弗朗西斯、Sage等期刊)。這樣一來,非專業(yè)人士也可以更好地理解研究內(nèi)容。這些人可能包括出資機(jī)構(gòu)(他們希望了解研究經(jīng)費(fèi)的使用情況)、研究參與者(如臨床試驗(yàn)或參與性行動(dòng)研究項(xiàng)目的參與者)、政策制定者(致力于在特定領(lǐng)域制定法規(guī))、或者來自關(guān)聯(lián)學(xué)科的研究人員(可能正在進(jìn)行跨學(xué)科研究)。
研究人員需要簡明語言
另一個(gè)未明確提及但可能受益于簡明語言摘要的群體是使用另一種語言從事研究的學(xué)者。實(shí)際上,這是一個(gè)龐大的群體。全球只有少數(shù)研究人員和研究生以英語為母語,那就意味著許多人必須通過另外一種語言來參閱科學(xué)文獻(xiàn)。
英語簡明語言摘要至少在兩個(gè)方面看見惡意幫助非英語母語的研究人員。首先,簡明語言摘要可能比傳統(tǒng)的科學(xué)摘要更易閱讀和理解,這減輕了研究者的認(rèn)知負(fù)荷,有助于研究人員更快地判斷文章是否與他們的工作相關(guān),從而決定是否值得深入閱讀;其次,簡明語言摘要更易于翻譯,這意味著研究人員可以使用機(jī)器翻譯將摘要從英語翻譯成他們的母語,以了解文章的主要內(nèi)容并決定是否值得深入閱讀相應(yīng)的科學(xué)文章。
簡明語言與和機(jī)器翻譯
作為一個(gè)宏觀項(xiàng)目的一部分,我們從多個(gè)不同的角度審視了簡明語言,并對簡明語音摘要的生成和機(jī)器翻譯進(jìn)行了一些初步研究。
首次調(diào)查集中在誰應(yīng)該撰寫簡明語言摘要。許多科學(xué)期刊鼓勵(lì)作者用簡明語言摘要總結(jié)工作。然而,雖然這些作者是學(xué)科專家,但他們并不一定接受過寫作或傳播方面的培訓(xùn)。相比之下,從事新興科學(xué)傳播領(lǐng)域的人通常具有雙學(xué)位,例如獲得理學(xué)學(xué)士學(xué)位并獲得新聞學(xué)或傳播學(xué)碩士學(xué)位。
加拿大科學(xué)出版社(CSP)在科學(xué)、工程和健康科學(xué)等各個(gè)領(lǐng)域出版了23種科學(xué)期刊。在其網(wǎng)站上提供兩種不同類型的簡明語言摘要,一方面,出版社鼓勵(lì)期刊作者寫自己的研究總結(jié),這些總結(jié)發(fā)布在CSP的媒體網(wǎng)站上,可以免費(fèi)閱讀。另一方面,CSP還運(yùn)營著一個(gè)公共博客,博客里有一個(gè)分類是“簡報(bào)”,其中包含由科普人士寫的簡明語言摘要。
傳播科學(xué)
我們構(gòu)建了兩個(gè)不同的語料庫,對應(yīng)于兩種不同類型的簡明語言摘要——分別由研究人員和科普人士寫的摘要——并比較了它們的一些特征。主要發(fā)現(xiàn)如下:
研究人員的簡明語言摘要總體上較短,但句子長度較長,被動(dòng)語態(tài)也使用得更多。通過采用Flesch易讀性和Flesch-Kincaid等級,計(jì)算這兩種類型的摘要的可讀性,評估發(fā)現(xiàn),科普人士撰寫的摘要比研究人員寫的摘要更簡單易懂。這并不驚訝,因?yàn)檠芯咳藛T主要是科學(xué)家或工程師,而科普人士是訓(xùn)練有素的傳播專業(yè)人士,知道如何為非專業(yè)讀者寫作。這個(gè)研究提供了切實(shí)的證據(jù),即如果出版商想出版科學(xué)研究,比起聘請一位研究人員,聘請一位好的科普人士更具性價(jià)比。
接下來,我們研究哪種類型的摘要更容易翻譯。在這種情況下,我們測試了三種不同類型的摘要:一,由研究人員編寫的傳統(tǒng)科學(xué)摘要;二,由研究人員編寫的簡明語言摘要;三, 由科普人士編寫的簡明語言摘要。
所有源文本均為英文,使用免費(fèi)在線版本的DeepL將文本翻譯成法文。
隨后評估了翻譯的準(zhǔn)確性和流暢性。再次發(fā)現(xiàn),由科普人士撰寫的簡明語言摘要表現(xiàn)最佳,而由研究人員編寫的簡明語言摘要排名第二,而傳統(tǒng)的科學(xué)摘要被認(rèn)為是最不容易翻譯的。
這些結(jié)果相當(dāng)直觀。從過往經(jīng)驗(yàn)中來看,將機(jī)器翻譯與受控語言相結(jié)合翻譯的成功性要高于將機(jī)器翻譯直接用于非受控自然語言。
我們測試機(jī)器翻譯和簡明語言結(jié)合的靈感之一來自Shaimaa Marzouk和Silvia Hansen-Schirra(2019)的一篇文章,題為“相對于其他機(jī)器翻譯體系結(jié)構(gòu),受控語言對神經(jīng)機(jī)器翻譯(NMT)的評估和影響”。這些研究人員發(fā)現(xiàn),受控語言(一種人工設(shè)計(jì)的語言)與神經(jīng)機(jī)器翻譯(一種數(shù)據(jù)驅(qū)動(dòng)的機(jī)器翻譯方法),配合效果不佳。因?yàn)槭芸卣Z言并未被廣泛采用,因此在神經(jīng)機(jī)器翻譯引擎的典型訓(xùn)練語料庫中很難得到充分的表達(dá)。相反,簡明語言的使用在過去幾十年中逐漸增加,因此在訓(xùn)練語料庫中能查找到的可能性更大。此外,為簡明語言寫作制定的指南類型與為機(jī)器翻譯寫作制定的指南存在較大的重疊。
結(jié)論
簡明語言的使用正在增長,因此了解更多相關(guān)信息對我們很重要。對于誰應(yīng)該編寫簡明語言摘要以及簡明語言摘要便于翻譯的程度的這類初步研究將幫助我們更多地了解簡明語言。
本文來自GALA(Globalization and Localization Association)官網(wǎng),由新宇智慧編譯,有刪減。