5-things-to-do-at-ata57

翻訳メモリのペナルティ

こんにちは、SDLジャパンの土田です。こちらのブログで、Trados Studioを中心としたSDL製品の技術的な情報をお届けしています。

以前の記事で「文字幅の違いについて一致を取得(アジアの原文言語)」というオプションについてご紹介しました。

Trados Studioによる全角・半角文字の自動認識

ここで翻訳メモリ(TM)の「ペナルティ」に関して触れているのですが、そもそもTMのペナルティとはどのようなものなのでしょうか。順番が前後してしまいましたが、今回はこちらについてご説明したいと思います。


ペナルティとは何か

ペナルティとは、TM内の原文と翻訳対象の原文との間に以下のような関係がある場合に、任意の数字を差し引いた形で一致率のパーセンテージを調整する機能のことを言います。

-    テキストとしては一致しているが、付随的な要素で異なりがある場合
-    テキストとしては一致しているが、信頼性をいったん留保する必要がある場合

例えば、翻訳対象の原文と100%同じ原文テキストがTM内に見つかった場合、Trados Studioは既定ではTMから訳文を自動入力し、さらに翻訳を確定します(この挙動は設定で変更可能です)。

しかし「テキストとしては一致しているが、翻訳を確定する前に翻訳作業者による確認が必要である」という事態も考えられます。このような時に、一致率のパーセンテージをあえて差し引くことで、翻訳作業者に注意喚起を行なうという意図から実装された機能です。

それでは、ペナルティの設定はどこで行なうのでしょうか。[プロジェクトの設定]より、[言語ペア]>[全ての言語ペア]>[翻訳メモリと自動翻訳]>[ペナルティ]を開きます。

2019-08-23_1

設定可能なペナルティの種類として、以下の5種類があります。

-    書式の欠落によるペナルティ
-    異なる書式によるペナルティ
-    複数の訳文によるペナルティ
-    自動ローカリゼーションによるペナルティ
-    整合によるペナルティ

複数の訳文言語を対象としたプロジェクトで、訳文言語ごとにペナルティの設定を変えたい場合、[すべての言語ペア]ではなくそれぞれの言語ペアから[翻訳メモリと自動翻訳]>[ペナルティ]を開きます。

また、「文字幅の違いによるペナルティ」に関しては、先ほどもお話しましたように、下記のブログで詳しく述べています。

Trados Studioによる全角・半角文字の自動認識

先にあげました5種類のペナルティそれぞれに関しまして、詳しくお話します。


書式の欠落によるペナルティ

「書式の欠落によるペナルティ」および「異なる書式によるペナルティ」について見てみましょう。ここでの「書式」とは太字、斜体、文字色などを言います。

「書式の欠落によるペナルティ」とはTM内に存在する原文に何らかの書式が追加されているが、翻訳対象の原文にはこれらの書式が存在していない場合に適用されるペナルティです。

2019-08-23_2

上の例では、TM内の原文では「Machine Translation」という言葉に太字の書式が追加されているのに対し、翻訳対象の原文には太字の書式がなく、「書式の欠落によるペナルティ」が適用されています。

反対に、TM内の原文には書式が存在しない一方で、翻訳対象の原文にはこれらの書式が追加されている場合、「書式の相違によるペナルティ」が適用されます。

2019-08-23_3

こちらの例では、TM内の原文には太字・斜体・文字色などの書式が全く存在していませんが、翻訳対象の原文においては「Machine Translation」という言葉に太字の書式が追加されています。このような場合は「書式の相違によるペナルティ」の対象となります。

なお、同じ文章の同じ箇所に対して、TM内の原文と翻訳対象の原文でそれぞれ違う書式が追加されていた場合については、自動で書式の置換がなされます。

上の例で言えば、TM内の原文においては「Machine Translation」が太字で、翻訳対象の原文においては「Machine Translation」が斜体だったとします。

こうした場合は、自動的に太字から斜体への置換がなされ、ペナルティは加算されず100%一致として取得されます。


複数の訳文によるペナルティ

こちらは、「TMの中に一致が見つかるものの、原文は同じで訳文だけが異なる候補が複数存在した」という場合に適用されるペナルティです。

2019-08-23_4

例えば上の例では、「Trados Studio can connect to a Machine Translation (MT) provider.」という翻訳対象の原文に対して、まったく同一の原文がTMに見つかりました。

しかし、TM内には同じ原文で訳文の異なる複数の翻訳単位が存在しています。こうした時にペナルティを適用して一致率を下げ、訳文が100%一致で自動確定することを保留します。

このタイミングで翻訳担当者は複数見つかった訳文のうちどれが適切なものであるか、判断する余裕が与えられます。


自動ローカリゼーションによるペナルティ

原文内に含まれる日付、時刻、単位のみが異なっている場合、Tradosは自動的に差分を置換し、訳文に反映します。この際に、「自動ローカリゼーションによるペナルティ」を設定できます。

既定では0%となっていますので、設定を変更しない限りこれらの置換は自動的に行なわれ、一致率も100%となります。

しかしこの数値を1%以上に設定すると、以下のような表示になります。

2019-08-23_5


テキスト置換によるペナルティ

翻訳メモリには「変数」という設定項目があります。ある一定の文字列を、翻訳不要な固定の文字列として登録する機能です。例えば、製品名や型番などを登録すると便利です。

この変数に登録された文字列のみが、TM内の原文と翻訳対象の原文とで異なっている場合、「テキスト置換によるペナルティ」が適用できます。

こちらも既定では0%となっていますので、設定を変更しない限りこれらの置換は自動的に行なわれ、一致率も100%となります。

2019-08-23_6

上の例では、「TCP」という文字列と「UDP」という文字列のみが異なっています。どちらもTMの変数リストに登録済みの場合、「テキスト置換によるペナルティ」の数値を1%以上に変更すると一致率が差し引かれます。

TMの変数は[設定]>[言語リソース]>[変数リスト]より編集が可能です。

2019-08-23_7


整合によるペナルティ

次に「整合によるペナルティ」です。これは、TMからの一致が取得された場合であっても、検索されたTUが「整合」機能の結果インポートされたものである場合に適用されるペナルティです。

整合によってインポートされたTUは、Trados上での翻訳作業によって更新されたものではないため、場合によっては信頼性をいったん保留したほうが良いこともありうるからです。

2019-08-23_8

このような場合、訳文の右側に、整合のもとになった原文ファイルと訳文ファイルの情報が表示されます。もちろん[整合によるペナルティ]の設定で値を0にすれば、この翻訳結果は100%一致として取得されます。


翻訳メモリ全体に対するペナルティ

最後に、翻訳メモリ全体にペナルティを設定する方法についてお話します。

たとえば、「メインで使用する翻訳メモリは決まっているのだが、他にもレファレンス的に別の翻訳メモリを使用したい」といったケースを考えて見ましょう。

2019-08-23_9

メインで使用するTMに加えて、レファレンス用のTMを割り当てました。しかしここから取得する翻訳結果はあくまで参考として利用するだけですので、TM全体にペナルティを設定しています。ここでの数値は3とします。

2019-08-23_10

こちらが翻訳結果です。レファレンス用のTMから得られた翻訳結果は、本来であれば100%一致であるところが、「翻訳メモリまたは自動翻訳サーバーによるペナルティ」が適用され、97%に一致率が差し引かれています。