future TM

翻译记忆库技术的未来

本博客的第一部分,我们介绍了翻译记忆库 (TM) 的历史和 SDL 在这些年来如何破解发展难题并取得成功。在第二部分,我们将会远瞻翻译记忆库技术的未来发展。

为此,我们采访了 SDL 的两位行业专家:在翻译行业经验丰富的产品管理总监 Daniel Brockmann 和精通软件开发和翻译的首席研究工程师 Kevin Flanagan

我们让 Daniel 和 Kevin 分享他们对于 TM 在未来所扮演的角色的看法,为此我们选择了当前最热门的话题:人工智能 (AI)

您认为 AI 在未来的翻译记忆库中会扮演什么角色?

DB:每个人都在谈论 AI 和机器学习,从 Siri 和 Alexa 到自动驾驶汽车,再到个人健康追踪等,AI 正在迅速发展。SDL 对机器学习并不陌生——我们在 2016 年推出了创新的自我学习自适应机器翻译技术——但问题是,这对翻译记忆库意味着什么?有一天,我们可能会看到这样的场景:AI 让翻译效率更上一层楼——成为 CAT 工具的核心。

AI 的一个显著优点是,改进翻译建议。例如,我们将翻译记忆库与术语和神经机器翻译 (NMT) 结果相结合,从而得到最佳的匹配,只需审校即可使用,而不是从头开始翻译。比如可以使用某行业领域的大型 TM 和术语库来训练神经机器翻译引擎,进一步提高 NMT 的质量,为任何特定使用案例提供更佳的翻译。或者将翻译记忆库和术语内容完美结合起来,增强 NMT 的结果。

无论如何,这样做并不是为了取代人工译员,而是帮助他们更有效地监督翻译流程,进一步微调初译结果。

KF:除了提高译员工作效率这一重要优点外,AI 还可以对 TM 进行分析并识别与新项目最相关的 TM,从而提高项目效率。对于同时处理多个项目和资源的项目经理而言,这可以帮助他们在项目供应链中更有效地发送内容,这让他们如获至宝。

在未来的云计算中,翻译记忆库将如何工作?其优势是什么?

DB:基于云的 TM 将为供应链中的所有参与者提供令人兴奋的新功能。最后,TM 共享将普遍融入工作流中,每个人都能利用这项宝贵的资产——LSP 能够更轻松地分享资产,自由译员可以组成团队协调工作,大型企业推动大型翻译项目等,不一而足。那些能够将云工作方式与丰富而强大的桌面环境集成在一起的人,将能从这场竞争中胜出。例如,SDL Trados Studio 中的 LookAhead 等最新发展将为基于云的 TM 提供与使用用户本地硬盘上的 TM 相同(甚至更佳)的性能体验。

TM 如何在增强的翻译环境中工作?

DB:现在有三种主要的资源可供译员使用,使他们的工作更轻松、更有效。第一,传统 TM,没有什么比 100% 或上下文匹配更让人欣喜。第二,传统的术语管理,确保术语翻译的质量和一致性。第三,如今的神经机器翻译。对于那些现有的语言对,在 NMT 的助力下,机器翻译的质量“让人刮目相看",可以完全无缝地插入翻译流——尤其是因为它日益被客户和译员所接受。

现在想象一下,这三种资源协调工作——术语增强 NMT 的建议,NMT 片段增强模糊匹配等等。建立优质的 TM 并将它们与优质的术语结合使用,从长远来看,前景广阔且让人期待——这就是变革所在——优质的机器翻译。这并不意味着所有机器翻译都是完美的。相反——NMT 在语言流畅性方面仍有不足。但是,不流畅并不意味着不准确。这时,就需要译员和审校员提炼语言,确保译文符合客户的质量期望。

尽管如此,对于任何翻译流,NMT 无疑是一个令人兴奋的新工具。

翻译记忆库 vs 神经机器翻译——谁主未来?

DB:将来会有一种新的模糊匹配处理方法。这意味着什么?完全不需要编辑的 NMT 建议可能比通常需要编辑的 70% 或 80% 模糊匹配更好,即使这些模糊匹配已经“修复"。因此,未来的局面可能是:TM = 提供 100% 到 90% 模糊匹配,NMT = 提供 90% 及以下的模糊匹配,两者各施其职。当然,这也将对存在已久的定价模型产生影响。当 NMT 引擎对新内容的翻译让人满意时,客户会索要折扣吗? 译员会欣然接受吗?双方是否会达成合作共识?

除了这些预算问题之外,还提出了另一个问题,为了使 TM 与 NMT 能够协调工作,当前的编辑环境是否需要优化?

好消息是,在短期内 SDL Trados Studio 等 CAT 工具环境仍是开放式平台,它们可以完美地插入“任何"NMT 引擎,让用户继续以熟悉的方式工作。因此,它们非常适合将 NMT 自然地添加到用户一直使用(并且熟悉)的资源组合中,这种巨大的潜力不应被低估。此外,目前的 NMT 引擎提供的是句段翻译——这意味着它们自然适合基于句段的工作方式。

总之——至少在短期内,像 Studio 这样的 CAT 工具可以轻松“插入"NMT 中,相得益彰。

KF:随着质量的提高,从长远来看,我们可能需要重新考虑基于网格的编辑器。这些改变可能带来截然不同的编辑体验,以迎合新的工作方式,更好地审校 NMT 内容,而不是提供大量功能从头开始翻译——这一切将彻底改变。但是在过渡阶段,我们从客户那里听到,他们只是简单地将 NMT 添加到 Studio 的资源组合中,从而优化生产效率和节约成本。

如何提高未来翻译记忆库的用户体验?

KF:除了重新思考编辑体验之外,我们还展望在将来以文档为中心的 TM,因此对于 TM 匹配,您可以深入到原始文档和翻译中,查看整个文档的上下文。

此外,我们还看到了以知识库为基础的 TM。在找不到良好匹配时,不同于查找逐字对应的匹配,而是查找“最重要的概念/术语",查找到的 TM 匹配并不是句段的类似翻译,而是提供相关概念和术语的信息,帮助译员理解句段,从而妥善地翻译。

upLIFT 的未来是什么?

KFupLIFT 翻译记忆库的功能将不断完善。通过更好的单词对齐,子句段建议(我们称之为“片段")的质量将得到提高,匹配修复的性能也会得到增强。我们还研究:

  • 除了改善翻译建议,upLIFT TM 技术还为更佳的术语提取奠定基础
  • 从 upLIFT 基础构件开发得出的自动标记放置(甚至适用于匹配修复)
  • 基于 upLIFT 单词对齐结果,TM 维护更加智能,可以识别误译、数据损坏或错误的文档/句段对齐。

正如您所看到的,从 AI 到 NMT 再到云计算,翻译记忆库技术有着巨大的发展空间,让人翘首以待。您最期待哪些发展?您对翻译记忆库的未来有什么想法吗?请在下面的评论部分告诉我们。

希望了解更多有关翻译记忆库的信息吗?查看我们的翻译记忆库中心,您可以在这里找到有关 TM 的所有信息。