中日科技论文机器翻译系统研制成功 准确率达97%,有60%的内容的翻译精度可达到“信息适当,容易理解”的程度。这种翻译引擎的特点是,无论输入的句子多长,都能高效进行处理,特别是可以大幅度提高长句子的翻译精度。
中国科学技术信息研究所27日召开发布会宣布,由该所与日本科学技术振兴机构、京都大学共同开发的中日科技论文机器翻译系统研制成功。
近年来,随着人们对机器翻译的期待不断高涨,研制反应更快、精度更高的翻译系统显得越来越迫切。为此,日本科学技术振兴机构、京都大学与中国科学技术信息研究所开展长期合作,首先构建了以科技论文为基础的400多万条高品质中日双语数据库,之后采用了日本科学家研制的神经元网络翻译引擎对这些数据库进行学习。这种翻译引擎的特点是,无论输入的句子多长,都能高效进行处理,特别是可以大幅度提高长句子的翻译精度。
这样,通过大规模、高品质的中日双语数据库与最尖端的神经元网络翻译引擎相结合,中日双方构建了全球性能最高的中日日中科技论文翻译系统。利用该翻译系统进行的中译日翻译水准,经评估翻译率达到97%。而且,有60%的内容的翻译精度可达到“信息适当,容易理解”的程度。
在2016年12月举行的以亚洲语言为对象的国际机器翻译研讨会“WAT2016(Workshop on Asian Translation 2016)”上,该翻译系统在科技信息机器翻译任务的精度评估中,取得了第一名的成绩。
日本科学技术振兴机构代表冲村宪树、京都大学代表长尾真、中国科学技术信息研究所代表赵志耘以及中日研究人员和中国科技部官员参加了此次发布会。双方表示,期望该系统在未来发挥真正作用,为中日科研人员的交流提供方便,同时也将继续开展研究,为研制出精度更高的翻译系统而努力。