Trados JP Blog Image

PDFファイルの翻訳を行なう時のポイント

こんにちは、SDLジャパンの土田です。こちらのブログで、Trados Studioを中心としたSDL製品の技術的な情報をお届けしています。

今回はTrados StudioでPDF翻訳を行なう場合に気をつけたいポイントについてお話したいと思います。


PDF翻訳の際の前提

Trados StudioでPDFファイルを翻訳するにあたって、あらかじめ確認しておかなくてはならないことが数点あります。

まず1点目は、PDFファイルを直接Trados Studio上で読み込み翻訳を行う方法は、あくまで最終手段と考える必要があるということです。

Trados Studioでの翻訳作業は極力、PDFの作成元であるMicrosoft WordやAdobe InDesignなどのオリジナルファイルを使用してください。こちらが入手できなかった場合に限り、PDFを直接Trados Studioに取り込んで翻訳作業を行います。

2点目は、PDFファイルはTrados上でMicrosoft Word形式に変換されるということです。PDFはそのままでは編修可能なファイル形式ではないため、Trados Studioへの取り込み時にMicrosoft Word形式(docx形式)に変換されます。

上記の2点はTradosハンズオントレーニングやTrados認定試験で使用されるワークブックにも記載されています(初級コース パート1)。

最後に、翻訳対象のPDFがテキストPDFかスキャンPDFかをあらかじめ判断しておく必要があります。テキストPDFとはMicrosoft WordやAdobe InDesignから書き出された、文字情報がテキストデータとして埋め込まれているPDFです。こちらはTrados Studio上でそのままテキストデータを抽出することが可能です。

それに対してスキャンPDFは、紙媒体に出力されたドキュメントを光学スキャンし、そこから生成されたPDFファイルを指します。文字情報はすべて画像として処理されていますので、翻訳対象として抽出することができません。

こうした場合、TradosにOCR(光学文字認識)プラグインをインストールすることで、画像処理された文字情報をテキストデータとして認識させ、翻訳対象として抽出することが可能です。詳しくは下記のブログをお読みください。
https://www.sdltrados.com/jp/blog/ocr_for_japanese_text.html


翻訳作業完了時の注意点

PDFファイルはTrados Studioへの読み込み時にMicrosoft Word形式に変換されます。この変換後のファイルをもとにバイリンガルファイル(sdlxliff形式)が作成され、その上で翻訳作業がなされます。

したがって訳文を生成する際も、書き出されるファイル形式はPDF形式ではなくMicrosoft Word形式となります。こちらについても注意が必要です。

[一括タスク]の[訳文の生成]で訳文ファイルを書き出す場合、処理完了時に[エクスポートした文書が含まれるフォルダを開きますか?]というダイアログが現れます。

2019-11-26_1

 ここで[はい]を選択すると、プロジェクトフォルダ内の言語名のフォルダ(たとえば[ja-JP]や[en-US]など)のうち、訳文言語名のフォルダが開きます。ここで拡張子が「.docx」のファイルを探してください。こちらが成果物としての訳文ファイルです。

また[ファイル]>[別名(訳文のみ)で保存]からも訳文ファイルを保存できます。こちらの方法であれば、保存場所をデスクトップなど分かりやすい場所に指定できますし、保存時のファイル名も任意のものに変更可能です。

2019-11-26_2 

成果物をPDFで納品する場合、上記の方法で保存したファイルをいったんMicrosoft Wordで開き、PDF形式で保存し直す必要があります。