伊人大香焦线在线手机版,野花香日本电影高清免费观看7,亚洲欧美洲成人一区二区,国产每日更新高清在线,亲妺妺乱的性视频

中文
搜索

探討簡明語言摘要與機器翻譯寫作

發布時間: 2024年01月29日瀏覽量:

簡明語言(Plain Language Summaries)并非新概念,而且其應用場景正逐漸增加。簡明語音有時稱之為簡明寫作或通俗表達,簡明語言通常指讀者一讀就能理解的表達方式。

自2006年聯合國通過《聯合國殘疾人權利公約》(CRPD)以來,已有160多個成員國成功簽署,成為聯合國最成功的條約之一。作為CRPD的一部分,第2條明確將簡明語言列為可能需要采取的交流方式之一,以使信息更易于理解。

用通俗語言寫作的主要原因是確保讀者容易理解,而且也有利于提升讀者體驗、觸達新受眾,以及優化搜索引擎或翻譯流程。實際上,國際標準化組織已于2023年6月發布了該領域的第一個標準《ISO 24495-1:2023 簡明語言—第1部分:基本原則和指南》。



通俗易懂的語言能夠更廣泛地觸及受眾

簡明語言的立足點之一就是科學交流或研究交流。以前,研究人員通過專業平臺交流學術成果,比如期刊文章或論壇。而現在,越來越多的研究人員被鼓勵與更廣泛的受眾(包括非專業人士)分享他們的發現。這種推廣可以采取不同的形式(例如信息圖表、視頻等)。但最常見的形式是簡明語言摘要。越來越多的期刊,特別是在健康和科學領域,鼓勵研究人員提交研究成果的簡明語言摘要和傳統的科學摘要,與文章一同呈現(例如,加拿大科學出版社、泰勒與弗朗西斯、Sage等期刊)。這樣一來,非專業人士也可以更好地理解研究內容。這些人可能包括出資機構(他們希望了解研究經費的使用情況)、研究參與者(如臨床試驗或參與性行動研究項目的參與者)、政策制定者(致力于在特定領域制定法規)、或者來自關聯學科的研究人員(可能正在進行跨學科研究)。



研究人員需要簡明語言

另一個未明確提及但可能受益于簡明語言摘要的群體是使用另一種語言從事研究的學者。實際上,這是一個龐大的群體。全球只有少數研究人員和研究生以英語為母語,那就意味著許多人必須通過另外一種語言來參閱科學文獻。

英語簡明語言摘要至少在兩個方面看見惡意幫助非英語母語的研究人員。首先,簡明語言摘要可能比傳統的科學摘要更易閱讀和理解,這減輕了研究者的認知負荷,有助于研究人員更快地判斷文章是否與他們的工作相關,從而決定是否值得深入閱讀;其次,簡明語言摘要更易于翻譯,這意味著研究人員可以使用機器翻譯將摘要從英語翻譯成他們的母語,以了解文章的主要內容并決定是否值得深入閱讀相應的科學文章。



簡明語言與和機器翻譯

作為一個宏觀項目的一部分,我們從多個不同的角度審視了簡明語言,并對簡明語音摘要的生成和機器翻譯進行了一些初步研究。

首次調查集中在誰應該撰寫簡明語言摘要。許多科學期刊鼓勵作者用簡明語言摘要總結工作。然而,雖然這些作者是學科專家,但他們并不一定接受過寫作或傳播方面的培訓。相比之下,從事新興科學傳播領域的人通常具有雙學位,例如獲得理學學士學位并獲得新聞學或傳播學碩士學位。

加拿大科學出版社(CSP)在科學、工程和健康科學等各個領域出版了23種科學期刊。在其網站上提供兩種不同類型的簡明語言摘要,一方面,出版社鼓勵期刊作者寫自己的研究總結,這些總結發布在CSP的媒體網站上,可以免費閱讀。另一方面,CSP還運營著一個公共博客,博客里有一個分類是“簡報”,其中包含由科普人士寫的簡明語言摘要。



傳播科學

我們構建了兩個不同的語料庫,對應于兩種不同類型的簡明語言摘要——分別由研究人員和科普人士寫的摘要——并比較了它們的一些特征。主要發現如下:

研究人員的簡明語言摘要總體上較短,但句子長度較長,被動語態也使用得更多。通過采用Flesch易讀性和Flesch-Kincaid等級,計算這兩種類型的摘要的可讀性,評估發現,科普人士撰寫的摘要比研究人員寫的摘要更簡單易懂。這并不驚訝,因為研究人員主要是科學家或工程師,而科普人士是訓練有素的傳播專業人士,知道如何為非專業讀者寫作。這個研究提供了切實的證據,即如果出版商想出版科學研究,比起聘請一位研究人員,聘請一位好的科普人士更具性價比。

接下來,我們研究哪種類型的摘要更容易翻譯。在這種情況下,我們測試了三種不同類型的摘要:一,由研究人員編寫的傳統科學摘要;二,由研究人員編寫的簡明語言摘要;三, 由科普人士編寫的簡明語言摘要。

所有源文本均為英文,使用免費在線版本的DeepL將文本翻譯成法文。



隨后評估了翻譯的準確性和流暢性。再次發現,由科普人士撰寫的簡明語言摘要表現最佳,而由研究人員編寫的簡明語言摘要排名第二,而傳統的科學摘要被認為是最不容易翻譯的。

這些結果相當直觀。從過往經驗中來看,將機器翻譯與受控語言相結合翻譯的成功性要高于將機器翻譯直接用于非受控自然語言。

我們測試機器翻譯和簡明語言結合的靈感之一來自Shaimaa Marzouk和Silvia Hansen-Schirra(2019)的一篇文章,題為“相對于其他機器翻譯體系結構,受控語言對神經機器翻譯(NMT)的評估和影響”。這些研究人員發現,受控語言(一種人工設計的語言)與神經機器翻譯(一種數據驅動的機器翻譯方法),配合效果不佳。因為受控語言并未被廣泛采用,因此在神經機器翻譯引擎的典型訓練語料庫中很難得到充分的表達。相反,簡明語言的使用在過去幾十年中逐漸增加,因此在訓練語料庫中能查找到的可能性更大。此外,為簡明語言寫作制定的指南類型與為機器翻譯寫作制定的指南存在較大的重疊。



結論

簡明語言的使用正在增長,因此了解更多相關信息對我們很重要。對于誰應該編寫簡明語言摘要以及簡明語言摘要便于翻譯的程度的這類初步研究將幫助我們更多地了解簡明語言。



本文來自GALA(Globalization and Localization Association)官網,由新宇智慧編譯,有刪減。


相關新聞