past-present-translation-memory-technology

翻訳メモリテクノロジーの過去と現在

翻訳メモリ(TM)という概念が誕生したのは1970年代初頭。1980年代になると、それがさらに発展しました。しかし、SDLの翻訳メモリが形になったのは1990年代に入ってから。Windows版Translator’s Workbenchの誕生です。これは本当の意味で幅広く普及したTMエンジンの第1号となり、1995年に16ビット版、1998年には32ビット版が登場しました(前世代のDOS版も90年代初頭にある程度普及していましたが、ユーザーは非常に少数でした)。

なぜ飛躍的に普及したのでしょうか?

当時、機械翻訳は進化中ではありましたが、品質はあまりにもお粗末でした。また、Windows PCが組織や家庭に本格的に普及し、個人翻訳者も組織の翻訳者も、デジタルコンテンツの増加に対応するため、テクノロジーを積極的に取り入れ始めました。さらに、特定のニーズを持つオーディエンス専用のソリューションを提供することが、大きな支持を得るきっかけとなりました。例えば、Freelanceエディションの登場です。

翻訳メモリは翻訳支援ツールの心臓であり脳であるとも言えます。ところが、このテクノロジーは当初、懐疑的に見られていました。今では、翻訳メモリのない環境など想像できません。SDLは1990年代から翻訳メモリの開発を続け、お客様にとっての使いやすさを常に追求してきました。

翻訳メモリの進化

SDLは2005年にTradosを買収し、翻訳メモリを根本から見直してSDL Trados StudioGroupShareを生み出しました。当時の重要な目的の1つが、それまでお客様からWorkbench TMエンジンに寄せられていた要望に応えることでした。これには、訳文言語での訳語検索、コンテキスト一致や構造一致の概念の採用、完全なXML規格エンジンなどがあります。

翻訳メモリ機能の拡張

SDLの翻訳メモリは汎用性が非常に高く、生産性を強化する機能を提供するために何年もかけて進化してきました。例えばAutoSuggest辞書です。

AutoSuggest辞書は、翻訳メモリコンテンツから作成され、翻訳作業中にAutoSuggestを通じて語句やフラグメントを翻訳者に提案します。訳語検索もあります。これは、用語ベースなどから一致として検出されない単語やテキストを翻訳メモリで検索する機能です。

AutoSuggest辞書と訳語検索は翻訳支援ツールを日常的に使用するユーザーにおなじみの機能ですが、SDLのTMの進化に伴い、その他にもあまり知られていない非常に便利で高度な機能が追加されています。

SDLの翻訳メモリは分節ベースですが、段落ベースの分節化にも対応します。これは、アジア言語のような、文の構造が欧米言語と異なり、分節単位ではなく段落単位のほうが翻訳しやすい言語で便利です。興味深いことに、段落ベースの分節化がニューラル機械翻訳(NMT)によって若干復活してきているようです。段落ベースであれば、分節単位で翻訳するのではなく、段落全体のコンテキストを確認しながら翻訳できるためです。

SDL独自の機能として、ドキュメント構造を利用し、TM内でコンテキストを提供することもできます。単にコンテキスト一致を判別するだけでなく、ドキュメント内の構造的なコンテキスト(索引マーカー、見出し、リストアイテムなど)も考慮できるのです。構造的なコンテキストに応じて、分節の翻訳を変えなければならないことがあります。例えば、英語では索引エントリを小文字で記述しますが、見出しでは同じ内容の分節を大文字にする必要があります。

柔軟性

SDLの翻訳メモリの柔軟性は、翻訳業界唯一のアプリストアに現れています。SDL Trados Studio自体にもTMを管理、維持するさまざまな仕組みが用意されていますが、各種アプリを導入することで、さらに高度な作業方法が実現します。例えば、次のようなアプリを使用すると、原文テキスト、訳文テキスト、原文&訳文テキストをさまざまなファイル形式に変換できます。

1. SDLXliff2Tmx

2. SDL TmReverse Langs

3. SDL TmExport

4. SDL TmConvert

データとデータ保護への関心が高まっています。SDL AppStoreからダウンロードできる「SDL Data Protection Suite」アプリを使用すれば、TM内のデータを匿名化することもできます。

拡張性

SDLでは常に「規模への対応」を重視しています。つまり翻訳メモリでは、数百人ものユーザーが同時アクセスできるように規模を拡大できることだけでなく、インターネットに接続せずにローカルで作業する個人ユーザーにも配慮することが同じように重要なのです。

どのような場合でも、優れた操作性とパフォーマンスが欠かせません。これを実現するには、さまざまなストレージメカニズムや作業方法を可能にするソフトウェアの設計アプローチが必要です。SDLではこのアプローチを、ローカルデスクトップ環境で作業する「ファイルベース」と、複数のユーザーが同じリソースを同時に共有する「サーバーベース」に分けています。

ファイルベースのTMは個人ユーザーや最大3名の小規模チームに、サーバーベースはそれ以上の規模のチームに最適で、それぞれに適した効率性をもたらします。

SDLのサーバーベースTMは、数百人のユーザー(SDL Trados StudioとSDL Trados GroupShare)に対応でき、一元管理された翻訳メモリに対して統制されたアクセス権を期間限定で提供することで、より一貫した翻訳を実現します。翻訳作業中に資産をリアルタイムで共有できるため、コンテンツの再利用率が、デスクトップのみの環境では実現しないレベルに向上します。

生産性を向上する機能が強化されたファイルベースの翻訳メモリとサーバーベースの共有の両方を提供するため、TMによる共同作業をお客様の状況に応じて進められます。つまり、個人翻訳者にも、短納期で大量の翻訳プロジェクトに対処しなければならない翻訳会社や企業にも対応できます。

upLIFT翻訳メモリテクノロジーの登場

長年にわたるTMの進化を経て、SDLにとって大きな節目となったのがSDL Trados Studio 2017のリリースです。翻訳支援ツールの主要機能をよりインテリジェントにするupLIFTテクノロジーが登場しました。

冒頭で、生産性の高いTM拡張機能としてAutoSuggest辞書と訳語検索を取り上げましたが、設定と作業を手動で行わなければならないという欠点がありました。それを変えたのがupLIFTテクノロジー、つまり「フラグメントリコール」です。

フラグメントリコールを支えるテクノロジーが、高精度の整合というプロセスです。TMは整合済みの分節ペア(翻訳単位:TU)から構成されているため、分節のあいまい一致や保存されている提案訳の取得といった分節レベルの処理は簡単です。これに対し、TU分節の一部分(1文内の語句や用語など)の一致や訳文の対応する部分の取得など、分節レベルよりも細かい処理は、より複雑になってきます。SDL Trados Studio 2017がこれを変えました。フラグメントリコールにより、ユーザーが何も操作しなくてもTU全体のフラグメントを自動的に確認できるようになったのです。

2016年のリリース以降、フラグメントリコールはさらに高度になり、精度が向上しています。現在では、フラグメント一致のソースをアイコンチップで確認することや、SDL Trados Studioのあいまい一致の修正機能によって自動修正されたあいまい一致を却下することもできます。

機能強化はこれで終わりではありません。SDL Trados Studio 2017 Service Release 1ではLookAheadという新機能が登場しました。翻訳メモリ(TM)の検索結果をバックグラウンドで取得することで、検索結果にこれまでよりも速くアクセスできるようにする機能です。翻訳作業中に分節を移動すると、その分節を翻訳している間にSDL Trados Studioが次の2分節の検索を実行するのです。これにより、検索結果(存在する場合)が事前に取得されているため、分節を移動するたびに検索結果がほぼ瞬時に表示されるという利点があります。

新しいコンテンツの追加が簡単

もちろん、翻訳メモリの管理や操作は重要ですが、コンテンツの追加登録も同様に重要です。

翻訳支援ツールの使用経験に関係なく、既存のコンテンツから翻訳メモリを作成できる翻訳の整合は、翻訳資産を即座に作成できる効率性に優れた手法です。SDL Trados Studio 2019 Service Release 1では、新しい選択機能と接続機能が追加され、分割機能と検索機能が強化されたことで、整合プロセスの汎用性と操作性が大幅に向上しています。

翻訳メモリ機能がさらに向上

コンテキスト一致とあいまい一致の精度を高め、翻訳一致がこれまで以上に多くなりました。コンテキスト一致の算出方法を改善して一致の精度を向上させただけでなく、ヨーロッパ言語の語幹解釈を強化し、あいまい一致の質も向上しています。

さらに、日本語の半角文字と全角文字をより正確に認識できるようにしました。この点はDTPでよく問題になることから、日本語の市場において大きな進歩だと思います。

この最新のService Releaseは、TMの改良に終わりはなく、強化の余地が尽きないことを示しています。SDL Trados Studio 2019では、AutoSuggest、LIFTフラグメントリコール、あいまい一致の修正などの大々的なイノベーションを語幹解釈の強化やあいまい一致の質の向上などの細かな進化と組み合わせることで、TMの活用率が劇的に向上しています。

これまでご説明したように、翻訳メモリは長い年月をかけて進化してきました。今後も、新たなイノベーションや機能を取り込んで進化を続け、TMの使用と管理がさらに容易になることでしょう。

今年、Tradosは35周年を迎え、私たちにとってはTMの未来を考える絶好のチャンスとなります。このブログの第2部では、SDL TradosのProduct DirectorであるDaniel BrockmannとupLIFT翻訳メモリテクノロジーのクリエーターであるKevin Flanaganが、未来に向けてTMが果たす役割について話し合い、AIやNMT、クラウドについても取り上げます。