産業翻訳は分野により文章の書き方が異なります。使われる専門用語も違います。翻訳会社の営業だと名乗ると、「社外の人に専門分野の翻訳は無理ですよ」と嘲笑まじりの発言をよく耳にします。続けて「外部の人に専門用語はわかない」とも言われます。

こういう人への対応は、試しに1ページだけ翻訳をやらせてもらい、評価をお願いすることです。優秀な翻訳者でしたら、短時間で特定の分野をリサーチして、用語や文体まで真似て、専門家の文章に近づけることができます。

この方法で原子力関連のサンプル翻訳を提出したときのことです。
「これは原子力発電に関わっている人が書いたものですよね?」
「いいえ、経済学部卒の翻訳者です。原子力に関わったことはありません」
その方は、原稿から目を離さずに驚きの表情を見せていました。

このような翻訳者の実力を機械翻訳で再現することは可能でしょうか?近づけることはできます。ただし、大量のコーパスが必要になります。

機械翻訳に不可欠なのは、コーパスという原文と訳文が一文ずつ紐づけされた文章の塊です。これを機械翻訳に学習させて翻訳をおこなうと、学習内容が反映され、ユーザーの指定する文章スタイルや用語を反映した訳文が生成されます。

さて、このコーパスは、わたしたちのような機械翻訳の開発をする会社にとっては、かけがえのない資産となります。機械翻訳システムを車に例えるなら、コーパスはガソリンといったところでしょう。電気自動車なら電気、水素自動車なら水素にあたるものです。偶然にも、わたしたちは翻訳システムを翻訳エンジンとよんでいます。

コーパスはゼロから作ることもありますが、これまでに翻訳を行って生まれたコーパスを利用する事例の方が多いのです。外部に翻訳を依頼していたら、翻訳会社にコーパスが残っているかもしれません。それは、翻訳支援ツールを使う翻訳会社が多いからです。このソフトは、原文を1文ずつ左のマス目に表示して、右のマス目に訳文を記入する仕組みになっています。翻訳作業が終わると、原文と訳文がペアになった翻訳メモリ、通称 TM(Translation Memory)が生成されます。これを機械翻訳に学習させます。

御社の資料を自社の文章スタイルと用語を反映させた訳文にするデータが眠っていないか、一度パソコンの中を調べてみてください。

なかったらどうするか。ご安心ください。原文と訳文のファイル(WORD、PDFなど)が個別にあれば、わたしたちが有償で1文ずつ紐付けしてコーパスを作ります。もちろん、ご自分で作ることも可能です。

お問い合わせ

深層適応型機械翻訳