目次

ご覧になりたい項目をクリックしてください。読み終えたら、各ページの最初にある Main をクリックするか、ブラウザーの戻るボタンでこの目次に戻り新たな項目をご覧ください(・は工事中)。

最新記事


計算して置換 和暦西暦の換算

*翻訳の考え方
はじめに・

原文の構造解析1
原文の構造解析2
原文の構造解析3
原文の構造解析4
動詞活用の正規表現
並列の意識 政策文書を例に
原文から訳文へ・
ワードから秀丸を動かす1
ワードから秀丸を動かす2
訳文の縦積翻訳1・
訳文の縦積翻訳2・
訳文の縦積翻訳3・
転記か削除か
検索置換による翻訳
重複処理の防止
正規表現を使った翻訳のマクロ
翻訳テキスト処理の効率化セミナー

*AHK編
AHKによるテキスト受け渡し

*秀丸編
テキストのアウトライン表示
秀丸間の移動
文字固定 特殊文字利用
同じ文字列の扱いを変える
カンマの後の改行 前方不一致
計算して置換 和暦西暦の換算
単語の認識
区切り防止
統一 /と%(秀丸)
統一 括弧(秀丸)
行の入れ替え
テキストの入れ替え
選択して文末移動

*ワード編
翻訳効率向上のためのワード活用法(入門編)
文字固定 書式利用
引用符の個別指定
入替 行
統一 /(ワード)
統一 括弧(ワード)
括弧1 括弧の表記法
括弧2 検索置換
括弧3 正規表現(1)
括弧4 正規表現(2)
括弧5 正規表現(3)
括弧6 正規表現(4)
括弧7 正規表現(5)
翻訳の正規表現 セミナー資料

*翻訳あれこれ
部分と全体
語釈を作る
切ってつなぐ
段取り
括弧書き
世界に影響される
訳文を磨く
1対0の関係
船に刻む
わかりにくい原文
数字の日本語表記
敬語表現
形式ではなく内容を移す
語順の入れ替え
なぜ変わらないのか
組織名の英語表現から
懐かしき山や川

| | Comments (0) | TrackBack (0)

2017.02.15

計算して置換 和暦西暦の換算

日本語の文書を英語に翻訳するときに文中にある和暦を西暦に直さねばならないことがある。昭和20年8月15日を15 August, 1945(表記は英米でまた時代により多少違いはある)とするようなときである。

これを機械にやってもらうにはどうしたらよいか。検索と置換を使うのであるが、単に数字を転記し年月日の順番を入れ替えるだけでは年が合わなくなるので、年数の計算が必要になる。例えば昭和であれば、その年数に1925を加えて西暦とするという操作が要る。

置換のときに一緒に計算をすることができれば便利であるが、テキスト処理のエディターにはエクセルのような関数がない。さてどうするか。

仕事にはテキストエディターとして秀丸を使っているので、そのサポートフォーラムに相談をしてみた。残念ながら、replaceallの一回の置換での数値演算はできないという。

しかし検索された文字列を取得してから計算し、その計算結果を挿入するという方法を秀丸担当さんからお教えいただいた。そのマクロは以下の通りである。

setcompatiblemode 0x20000;
disabledraw;
gofiletop;
$s="昭和([0-9]{1,2})年";
while(1){
searchdown2 $s+"(?\\1)",regular;
if(result==false) break;
$found=gettext(foundtopx,foundtopy,foundendx,foundendy);
replaceup $s
,str(val($found)+1925)+"年"
,regular;
}

これを使うと昭和で記されている和暦が西暦になる。平成なら上記のスクリプトの1925の部分が1988となる。

なお和暦の表示が明治大正昭和平成ではなく、明大昭平であったりMTSHになっていることもあるので、実務で使うときには、上のスクリプトの検索条件を案件に合わせて変更したり、最初から何種類も用意しておく必要がある。1つ作ればすべてが賄えるわけではない。それは置換後の英文表記についても同様である。

年数の西暦換算だけなら以上であるが、年月日まで完全に置換で翻訳したければ、もう一度検索置換をする。上のマクロで昭和20年を1945年に直したうえで、1945年8月15日という文字列全体を対象に、従来通りの検索置換を行い15 August, 1945に直すのである。そのスクリプトは次の通り(これは1月用。2月から12月も同じように用意しておく。西暦1000年以降について対応)。

replaceall "(1|2)([0-9]{3})年1月([0-9]{1,2})日", " \\3 January, \\1\\2" , regular, nocasesense, inselect, nohilight;

処理の対象が年月だけの場合のスクリプトも加えておく。こちらについても12か月分必要になる。

replaceall "(1|2)([0-9]{3})年1月", " January, \\1\\2 " , regular, nocasesense, inselect, nohilight;

これで当初考えていた「置換の際に数値の計算をして、和暦西暦の換算のうえ、翻訳する」という作業をすべてパソコンに任せることができた。

以上、同じようなことをお考え方の参考になれば幸いです。またこれをお教えくださった秀丸エディタ&関連ソフトサポート会議室の秀丸担当さんに感謝します。

| | Comments (0) | TrackBack (1)

2017.02.13

部分と全体

翻訳をするときには余り小さく区切って全体を見失わないようにと注意される。段落全体で何が語られているかを理解し、前後の文章を把握し、その文脈の中で訳す必要がある。さてそれは部分とどのような関係になっているのか。全体観を得るにはどうしたらよいのか。

(1)考えてみると全体観はいきなり得られるものではない。まずは細かく区分されたもの(それは単語のことも熟語のこともある)がどのような意味なのかを正確に理解することから始まる。辞書を引くのはそのためである。場合によっては手書きの文字の解読から始まることもある。

(2)そのうえで、その区分されたものが他の小区分とどのような関係にあるのかを考える。例えばその単語なり文節が、他の単語や文節と対比したときに、並列なのか、順接なのか逆接なのか、装飾・被装飾の関係にあるのかを理解する必要がある。

他の単語との関連を検討したうえで、辞書にない表現を考える必要も出てくる。単語が熟語の中で使われると意味が変わる場合があるのも、このような関係性を勘案するからである。

(3)そのような部分の確認作業をした後に初めて、区分されたものが一つの文章の中でどのような位置付けになっているのか、前後の文章や段落との関係で辻褄が合っているのかを考えることになる。筆者の言いたいことが読み手の中である程度まとまった形で姿を現すようになるのは、このような手順を踏んでからのことである。

訳文を作っていく際に全体の中での均衡を吟味し当初の理解で良いのかを検討するのは、この段階の話である。その前の検討を飛ばしてはいけない。

(随分前のことになるが、欧米諸国が国際データ流通(Transborder Data Flows)を問題にしたことがあり、米国議会の立法の動き追ったことがあった。そのときに米国の文献にsun setという言葉が出てきて、20代半ばの自分はサンセット法と訳した。個別の単語に捉われて全体観を得ることがうまくできなかった例である。今なら時限法と訳すであろう。)

部分と全体は密接につながっている。どちらか一方では不十分。全体観を大切にという議論はもっともであるが、それは「各部分を丁寧に確認する」ことを前提にしての話である。部分を確認しつつ、次第に浮かび上がる全体像を見ては、部分に戻ってそれを修正する。その繰り返しにより全体の像が明瞭になってくる。全体観が単独にあるのではない。

それは訳文を作るときも、自分の文章を書くときも同じ。部分と全体の両者を往復しなければ首尾の整った文章は書けない。その往復により自分の思考が少しずつ明晰になってくるのである。

| | Comments (0) | TrackBack (0)

2017.01.29

並列の意識 政策文書を例に

何かを言おうとしたとき、同列のものがあれこれ思い浮かぶことがある。それを表現するときには並列を明らかにする工夫がいる。工夫は漢文の四六駢儷体や対句、日本の和歌や長歌、日常の慣用句や歌謡など、さまざまなところに見られる。その事情はどの言語でも同じである。

では並列の工夫とはどのようなものか。文章の中で並列になっている状況を観察すれば、並べられているものは文節であることも、動詞であることも、形容詞や副詞であることもあるが、そこで大切なのは同じ品詞、同じ文法構造に揃えることであるというのが見えてくる。そのうえで欲を言えば似た音韻、内容的にも同類か近類にすれば趣も出てくる。

詩歌などは別にして、日常的な散文や実用的な文章では並列を明らかにすれば、読者が理解しやすくなる。例えば上の「並列は文節であることも、動詞であることも、形容詞や副詞であることもある。」という文では、「あることも」を繰り返して、同列の要素をわかりやすくしている(しかし同じ表現を機械的に繰り返すのではあまり芸がなく、適度な変奏があった方が楽しいが)。

上に述べたことは書くときの注意であるが、読むときにも同じような意識を持てば誤読が少なくなる。動詞の並列や形容詞の並列に着目してみる。そのうえで意識を視覚化すればさらに理解が楽になる。

実はこれが翻訳のうえで役に立つ。並列を意識することが、正確な原文理解とその先の縦横変換で力を発揮するのである。例えば政策文書。抽象度の高い言葉遣いで、ともすると理解が上滑りになる。促進、奨励、誘導、振興、持続的、重点的、連携的、ガバナンスなどお役所言葉満載となる。

そのときには、書かれている文章の中に、並べられている概念がないかを探してみる(ときには品詞変換が必要になるが)。見つかったらその並列項目を箇条書きにする。お役所文書をそのまま使うわけにはいかないので、上の例の文章を使ってやり方を示せば、次のように区切るのである。

  並列は
  文節であることも、
  動詞であることも、
  形容詞や副詞であることも
  ある。

ここまですると、正確な理解ができるだけではなく、縦横変換(翻訳)もやりやすくなる。

幸いにして今の文書はすべてテキストが電子化されている。そこで並列概念に着目して文書を区切って縦積みにする。区切るのは手でするのではなく、機械にやってもらう。区切る部分を正規表現を使って指定し(上の例なら「ことも」という文字列に着目)、それを構造解析辞書に組み込む。そのうえでマクロを実行すれば文章が区切られる。こうすれば並列概念が簡単にわかるようになる。

原文が日本語でも外国語でも考え方は同じ。これで作業の効率が格段に良くなる。

| | Comments (0) | TrackBack (0)

2017.01.20

動詞活用の正規表現

動詞をその活用形まで含めて検索するにはどうするか。一番簡単なのは、それぞれを順番に検索することである。まずはそれが出発点。しかしもう少し頭を使ったやり方はないものか。そこで正規表現を使うことになる。

ではどのような正規表現を書けば良いのか。例えばlisten、listens、listened、listeningをすべて検索することを考える。

これを観察すると、原形、原形+s、原形+ed、原形+ingというパターンになっている。しかしこれらは並列の関係ではない。まずは言葉で表現してみると、これは「原形だけ、または原形+s もしく原形+edもしく原形+ing」という形である。それを論理式で書けば
  (原形だけ) or ((原形+s) or (原形+ed) or (原形+ing))
となっていて、入れ子構造であることがわかる。ここまで分解すれば正規表現を書きやすくなる。

活用を含めlistenをすべてを検索する正規表現は秀丸なら
   listen(s|ed|ing)?
となる。listenを検索するが、そのあとにs、ed、ingのいずれかが付いても付かなくてもいい、という意味である。

次にcombineという動詞はどうか。combine、combines、combined、combiningであるが、前のeatとは活用パターンが違う。活用するときは末尾のeを外してから活用形を付ける。

原形を出発点にするとeの処理のため正規表現が複雑になり、2段階処理をせざるを得なくなる。そこでcombinまでを仮の原形と考えて正規表現を作る。

論理式を書けば
  (仮の原形) and ((e) or (es) or (ed) or (ing))
であり、正規表現は
  combin(e|es|ed|ing)
となる。これは上記の例と違い正規表現の末尾に?が付かないことに注意。仮の原形のあとには括弧の中のいずれかの要素が必ず続かねばならないからである。

さて、このような考え方を何に使うのか。活用する動詞の一括検索の主たる用途は、英文の構造解析である。動詞の前後で区切り、その動作を明らかにすると共にあとに続く目的語との区別をするときに役立つ。

上記2つのパターンを構造解析辞書に組み込むだけで、かなりの比率で動詞を検索できる。残りは手作業でやっても十分である。構造解析についてはこちら(原文の構造解析1)。

今はさまざまな形態素解析エンジンがあるが、それを使うよりもまず自分に必要な部品だけ作ってみて、それを少しずつ改善していく方が、仕事がやりやすくなるように思える。

| | Comments (0) | TrackBack (0)

2016.10.29

同じ文字列の扱いを変える

今の日本語文書には漢字・平仮名・片仮名だけではなく欧文が普通に使われるが、そのような日本語を電子機器で入力していると余分な文字や半角の空白が文書に残ることがある。これを取り除くにはどうするか。

例えば半角の空白が文書の中に紛れていることは結構ある。それを削除するには、ワードやエクセル、テキストエディターなどのソフトに検索置換の機能を使う。半角空白を検索して置換後の文字列に何も入力しないという操作を行うのである。

これは単純な例であるが、さらに検索置換に正規表現を使うと、個別の文字をいちいち指定することなく一定の文字列を全て検索して削除することができる。例えば全角文字の中にある半角の英文字や空白を取り除くときには、秀丸のスクリプトなら
replaceallfast "([a-zA-Z ]{1,})", "" , regular, nocasesense, inselect, nohilight;
とすればよい。これによって全角文字の中にある半角の英文字と空白が全て削除される。

しかし日本語の文書であっても人名、組織、略語、書籍、論文などを欧文のまま残すことがある。文書の中にあるOECDという組織名、あるいはJames Watsonという人物名はそのままにして、それ以外の英文字を削除したいというような場合である。

上に掲げた正規表現では、残したい文字や半角もすべて削除されてしまう。同じ文字でも削除するものと残すものとを区別するにはどのような正規表現を書けばよいのか。それが今回の課題である。

これを実現するには、残したいものに標識を付けておいて、それ以外のものを削除するという2段階操作をする。

まず標識を付けるのであるが、ここでは標識にすみつき括弧を使ってみる。つまり残したい文字列の部分を【OECD】あるいは【James Watson】のようにするのである。

その次の段階で削除をするのであるが、最初はその論理を普通の言葉で表現してみる。実現したいのは
  和文の中にある英文字と半角空白を削除するが
  すみつき括弧内の英文字と半角空白は削除しない
ということになる。

単純化すれば
  ○○を削除するが
 【○○】は削除しない
である。つまり【○○】という形になっていない○○を検索して、置換後の文字列に何も入力しない、ということになる。

この検索を分解して表現すると、
  ○○の前に【がなく
  ○○の後に】がないときの
  ○○を検索する
ということである。

ここまで来ると実現したいことを正規表現にするまであと一歩になる。

前に【がない○○を検索するためには、前方不一致という条件式を使う。ある文字・正規表現の後に、別の文字・正規表現を指定したうえで、前方部分がないときの後方部分だけ検索することができるのである。条件式は?<!である。

後に】がない○○を検索するには、後方不一致を使う。ある文字・正規表現の後に、別の文字・正規表現を指定し、後方部分がないときの前方部分だけを検索するという条件式で、?!と書く。

これを使うと検索式は
  (?<![【a-zA-Z ]{1,})([a-zA-Z ]{1,})(?!】)
ということになる。

この正規表現の検索式を普通の日本語に翻訳すれば、前に【や英文字や半角空白がなく、後に 】が続かないときの英文字や半角空白を検索する、という条件である。ここですみつき括弧【を[ ]の外に出さずに[ ]の中に入れたのが味噌。

これですみつき括弧に挟まれていない英文字と半角空白を削除できる。つまり同じ文字列でありながら、すみつき括弧の有無で扱いを変えることが可能になるのである。

尚このスクリプトを用語辞書と組み合わせる場合は注意すべき点がある。用語辞書にある単語がすみつき括弧内にあるときには、検索対象から外すという工夫が必要になるのであるが、この干渉回避のやり方についての説明は別の機会に譲る。

| | Comments (0) | TrackBack (0)

2016.05.11

語釈を作る

辞書作りはそれぞれの言葉の意味を考えその語釈を作ることから始まる。編纂に携わる人は、知恵を絞ってさまざまな表現を試みている。それは新明解国語辞典の語釈などに見て取れる。

そのような姿勢は翻訳をするときにも当てはまる。辞書に載っている訳語ではぴたりとしないときには、自分で原文の言葉の意味を考え適切な表現を見つける必要がある。辞書にある表現のみが正解ではない。それにたくさんの辞書があり夫々表現が違うことも多い。自分が辞書作りの編纂者になったつもりで語釈を考える。

大切なのは自分で考えること。色々な辞書を集めてそれを探すのも一つの方法かもしれないが、それだけでは他人の考えを借用しているのと同じである。辞書にありませんでしたというのは、インターネットを検索して「ありませんでした」という学生と本質は同じこと。

特に研究や生産の最先端の言葉などは、それに携わる人々が必要に迫られて作っていることが多い。自分が異国のその研究室や生産現場で一緒に働いていると想像して訳語を考える。

重複翻訳(ある言語で書かれたものが既に別の言語に翻訳されており、それをさらに違う言語に翻訳するもの)でも辞書に載っている訳語ではうまくいかないことが多い。言語が違うと基本的な意味が同じ単語でも、その周辺に含まれるものが違ってくる。重複訳でそれが繰り返され思わぬずれになるのである。最初に書かれた言語の文書が見つかればいいが、そうでない場合も多い。やはり自分でどのような意味なのかを考えることが重要になる。

「探してありませんでした」では仕事は完了していない。なければ考えるまでである(探すは頼る)。


| | Comments (0) | TrackBack (0)

2016.05.09

切ってつなぐ

テキスト処理で行う構造解析とは、文章を意味の切れ目で区切ることである。しかし色々な事例があるので、どのような箇所を抜き出し(検索)、どのように区切るか(置換)を正確に指示しないと、思わぬところで区切られたり区切りたいものが連続したまま残るという事態が生ずる。

(1)正確な区切りをするときは、次のように予め区切ってはいけないテキスト(文字列)を個別に指定しておいて、そのあとで一括区切り処理を実行するのが普通のやり方である。このやり方には「区切る」ために「区切らない」ものも考えるという、地と図の関係というか裏表の思考法(転記か削除か)が含まれている。

   区切らないものを個別指定
   一括で区切る

(2)さらに一括区切り処理については、検索条件を工夫することで区切る対象を限定することができる。前方一致、前方不一致、後方一致、後方不一致の正規表現を使うのである。これが今までのやり方であった。

   区切らないものを個別指定
   区切る対象を限ってから一括で区切る

(3)しかし、それでもうまくいかないものが出てくる。区切って欲しくないのに区切られるという事例が出るのである。

どうしたら良いのか考えているうちにもう一段、別の次元で裏から考えるということを思いついた。つまりこれまでのやり方は「連続したものを区切る」という発想に基づいている。これによるときには、いかに切るか、いかに切らないかを考えるだけになってしまう。

しかし実は目的を達成する手段はそれだけではない。欲しいテキストとは、「あるところは連続し、あるところは区切られているテキスト」である。連続するテキストを得るためには「連続を残す」だけではなく「連続を作る」という方法もあると気が付いたのである。出発点が連続する文字列であったため、それに囚われて裏(切れている状態を出発点にする)を考えていなかったということになる。

要するに区切ったものをつなげばいいということ。区切りは改行記号を挿入して行っているが、すでに改行したものの中で改行してはいけなかった部分を検索して、そこにある改行記号を削除する工程を加えた。処理の流れは次のようになる。

   連続するものを区切る
    区切らないものを個別指定する (i)
    区切る対象を限定してから一括で区切る (ii)

   区切られているものをつなぐ
    つなぐものを個別指定する (iii)
    つなぐ対象を限定してから一括でつなぐ (iv)

最後の (iv) は (ii) の逆操作なので条件を相当厳密に指定する必要があり、まだ手をつけていない。取り敢えず (iii) の論理を加えた構造解析辞書を運用するようにしたが、前よりも区切りの精度が向上し、今のところはこれで十分である。

学んだのは、連続したものを切るばかりではない、切れているものをつなぐという発想も持ち合わせていないといけないということ。頭の柔らかさを試される経験であった。


| | Comments (0) | TrackBack (0)

2016.04.26

段取り

ドイツ系の企業グループの連結決算手続書を訳す仕事をしている。A4で200ページ。仕事に必要なものは翻訳支援ツール(今回はトラドス)とテキストエディター(いつもの秀丸)で、それにウェブ検索を組み合わせるというのは普段と変わらない。

ただ4万語の大きさになると、段取りを考えておくか否かで効率や精度に大きな差が生ずる。ここでの段取りとは、翻訳支援ツール、テキストエディター、ウェブ検索の三者の連携を良くすることであり、同時に三者それぞれの中での作業手順を十分に考えることである。

翻訳作業の中心になるのは、今回であればIFRSなどの会計基準を確認し、書かれていることを理解したうえで読みやすい訳文をテキストエディター上で作ること。それが本来の翻訳の仕事である。段取りをするのは、本業に専念できるようにするためである。

まずは翻訳に使う用語辞書の見直しがある。辞書にある用語は、訳文を作るテキストエディター(白紙訳文と名付けているもの)に自動的に入るようになっている。ただ正しい用語が出てこなければ訂正と新規入力の二度手間になるので、文書の内容に応じ会計用語、特に連結決算に関する用語を優先的に適用するよう辞書の組み直しをする。それと同時に、前方後方の一致不一致を制御する正規表現を使い、辞書の書き方を簡単なものにして処理速度を早くする。

また構造解析辞書の調整も必要になる。テキストの構造を視覚的に捉えられるよう、区切るべきところと区切ってはいけないところを指定するのであるが、それを今作業している文書に合わせて見直すのであ。ここでも前方一致、前方不一致、後方一致、後方不一致の正規表現が役に立つ。調整とは実際には、処理する対象に合わせてできるだけ正規表現を見直すことである。

それらの調整は既に組んである秀丸のマクロの修正になるが、さらに秀丸マクロに収まりきれない手順については、AHKを見直す。異なるアプリケーション間でのテキスト受け渡しにはAHKが必要になる。秀丸マクロもAHKも、一連の反復作業をキー登録してショートカットにする点では同じことである。

そこで考えておくことは、一連の作業をどこで区切りキー登録するのかということ。あまり長くしない方が良いこともある。

馬鹿の長糸という言葉もある。お作法と裁縫の授業がまだあった頃に女学校にいた母が聞いて覚えていて、話してくれた表現である。思慮の足りない娘は長すぎる糸で取り回しに苦労しているのに対し、賢い娘は使う場所にちょうどの長さの糸で手早く仕事を終えるという話。裁縫だけのことではない。仕事の内容を見極め、それにちょうど合うコンパクトな手段を選択することはいつでも大切。

また各操作をどこのキーに登録するかも考えねばならない。あちこちに分散していると手を大きく動かさねばならなくなる。さらに言えば、感覚や一連の手順に沿うような配列にすることも大切。上下左右の矢印キーは、アクティブ画面をその方向に切り替えるときに直感的に理解できるし、テンキーの123456に順番に行う操作を割り付ければわかりやすい。

段取りとは、旅客機が離陸し上昇して巡航速度に達するまでの間にたとえられるかもしれない。巡航速度に達してやっと機内サービスが始まるように、段取りを終えてから漸く本来の考える翻訳が始められる。段取りをおろそかにしてはならない。

いや段取りこそが、本来の仕事を効率よくしかも丁寧に仕上げる秘訣であって、それを含めて十全の仕事になると言った方が適切かもしれない。

そして段取りの各部分についてじっくり考えれば、道具を常に整備しておくといういつもの話になる。

| | Comments (0) | TrackBack (0)

2016.03.04

翻訳効率向上のためのワード活用法(入門編)

●はじめに
翻訳を始めて間もない頃はワードだけで仕事をしていました。その後色々なソフトを使うようになり、ワードについてもマクロなどを覚えましたが、ワードの基本機能だけでも翻訳効率と精度向上のためには色々な工夫ができます。

以下に述べるのは特別なソフトを使わず、ワードと添付の日本語入力(Microsoft IME)の環境で行える設定です。これだけでもかなりのことができ、これから翻訳を始めたい人や始めて間もない人のヒントになるかもしれませんし、帰省しているときや緊急のときなど普段の翻訳環境以外で仕事をするときにも役立つと思います。お話は英日翻訳を前提とします。

これは2015年10月に語学関連の出版をしている株式会社アルクの「翻訳通訳のトビラ」に、「翻訳効率向上のためのワード活用法(入門編)」として掲載させていただいたものです。転載をお許しいただいた同社メディア企画編集部の佐藤直樹さんに御礼申し上げます。

●画面の表示法
画面の表示法は、印刷レイアウト表示です。下書き表示、Webレイアウト表示、アウトライン表示は使いません。印刷レイアウト表示にするのは、それが紙に書くのと同じように自然に見えるからです。

●文書の背景色
最近は液晶画面のバックライトがLEDになり表示がかなり明るくなっています。このため白黒ではコントラストが強く、長時間画面に向かっていると目の負担が大きくなります。そこで作業をするときには背景色を薄いオリーブ色(RGBでR180、G185、B142)にしています。

他のソフトウェアでも色を変更できるときには、そのソフトでもこのオリーブ色とその明度違いに統一しています。対象となるのはデスクトップの背景、トラドスの各セグメント背景色、秀丸などです。さまざまなソフトの基本色調を同色に揃えると、画面が静かになり翻訳に集中できます(さらに言えば、集中するにはあまりたくさんの画面を開かず必要最小限にすることでしょう)。

●表示項目
開いたワードの画面にどれだけリボンやツールバーなどの情報を表示するかは各人の好みともいえますが、私は必要なもの以外はすべて非表示にしています。不要なものが表示されているとそれが思考の上で雑音となるからです。非表示にしておくものとしては画面上の変更履歴、罫線などのツールバー、ルーラー、本文内の編集記号、画面下の図形描画のツールバー、ステータスバーなどです。要するに実際の何も書かれていない紙に文字を書いていくのと同じような環境をワードでも作り出しているのです(実際の紙でも罫線や升目が入っていないただの白紙の方が雑念が排されます)。

もちろんそれらの情報を表示する必要が生じたり、マウスでそれをクリックする方が早いと感じるときには臨機応変に表示させます。またワードの機能に習熟していないときには、敢えて各種情報を表示する方が機能を覚えやすいかもしれません。

●用紙サイズと余白
パソコンでの翻訳作業では用紙のサイズを気にすることはありません。ただ用紙サイズが、印刷レイアウトで表示される行数や一行の文字数に影響してきますので、今は一般的となっているA4を指定します。また余白は上下左右とも25mmにしています。

●フォントと1行の文字数
フォントは横書きでの読みやすさからメイリオを使っています。またフォントのサイズは12ポイントにしています。

これは1行の文字数と関係してきます。つまり横書きで一行の文字数が多くなると視線の移動が大きく読みにくくなります。1行35字程度になるようにするとこのポイント数になるのです。

ただし1行の文字数なり行間は1ページの行数指定でも設定できるし、単独で指定することも可能です。また実際の画面での文字の大きさはズームと縮小(Ctrlキーとマウスのホイールを使います)で自由に変えられます。

●テンプレート保存
以上の準備ができたらその設定をテンプレートに保存します。これにより新しい文書は常にこの書式が適用されます。

●文字入力
文字入力にはIME以外にもATOKなど色々ありますが、私はIMEで十分と思っています。大切なのは単語登録をこまめにすることです。単語登録を工夫すれば入力のキーストロークの数が少なくなります。たとえば「登録」という漢字は「とろ」にしておくとか、「しく」で「してください。」とするなどです。文末などは句点まで登録するとかなりの省力になります。「をく」で「をクリックします。」など、色々用意しておくと便利です。

単語登録での読みは2文字か3文字にします。2文字なら入力は速いのですが、同じ読みのものが多くなると選択に時間がかかります。3文字ならストローク数が1文字余計になるので入力時間が増えますか、その読みで出てくる選択肢が少なくなるので選ぶのに時間がかからなくなります。まずは2文字で登録して、同じ読みの登録が増えてきたら3文字登録に切り替えるというような微調整をしながら両者を併用します。

うまく漢字変換ができるかどうかは文章を書くときの思考の流れに一番影響します。様々な単語を登録して育てた自分の辞書はバックアップをとり、その辞書はパソコンを変えても引き継いでいきます。

●親指シフト
今回の「ワードと添付の日本語入力の環境で行える設定」という枠から外れるのですが、日本語入力には多くの方がお使いのローマ字入力ではなく、親指シフトによるかな入力を使っています。これは各人の好みですが、親指シフトは思考を中断せず入力速度も速いように感じます。簡単なソフトを導入すればすみますのでお試しください。

●2つの枠
原文と訳文をどのように並べるかは翻訳効率に大きく影響します。大切なのは両者をできるだけ近くに並べることで、それにより比較対象が楽になります。具体的にはワード文書を2つ用意し(白紙原文、白紙訳文という名前のファイルを用意しておきます)、それを併置して開きます。その上で横長のウィンドウを上下に2つ並べるか、縦長のものを左右に並べるかします。

Vertical_2

または

Horizontal

私は縦長のものを左右に並べる方が使いやすいように感じています。それは英語と日本語の文章構造の違いに由来します。つまり英語の動詞は比較的先に出てきますが、それに対応する日本語の述語は文の末尾に来ます。そこで横長にすると視線が原文の左端と訳文の右端とで行き来することになります。それに対して縦長では上下の視線移動は多少あるものの左右はそれほど動かさずにすむからです。

●段組み
視線移動を少なくするという点では、段組みを活用することもできます。これは縦長のウィンドウを左右に並べるやり方の応用で、用意する文書は1つですみますが、そのままでは長い文書の翻訳には向いていません。

Column_3

段組みには段区切りの記号を目印にして、カーソル位置を原文側と訳文側で切り替えることができるというメリットもあります。ただこれをするためには多少VBAの知識が必要になりますので今回は割愛します。

以上、翻訳効率向上のためにワードをどのように活用できるか、その入門的なお話をしました。ある程度習熟してきたらマクロにも挑戦したくなるでしょう。あるいはテキストエディターを使う方がいいと思うかもしれませんし、複数のソフトの間でテキストの受け渡しをしたくなるかもしれません。それらについてはこの「翻訳のサロン」の該当記事をご覧ください。


| | Comments (0) | TrackBack (0)

2016.02.12

単語の認識

翻訳するときには原文欄と訳文欄を並べて、原文を見ながら訳文を書くようにしている。恐らくどの人も同じようなことをしていると思う。ただパソコンで訳文を書くなら、パソコンで可能なことはなるべくそちらにやらせたい。

そこで原文の中の言葉を自家製辞書と比較して、その辞書の訳語を訳文作成欄に自動的に出すという工夫が生まれる。出てくる場所も原文欄で当該単語のある位置に対応するように作る。

このようにして真っ白い訳文欄のあちこちに訳語が出てくる(原文は一切出ない)。それが訳文作成時の発想の出発点になる。ちょうど硫酸銅の青い溶液の中に種となる結晶のかけらを吊るして大きな結晶を得るようなもので、これを「結晶方式」と名付けている。原文の中に訳語が混じる混在文を使う方式とは異なる。

しかしあるとき、この発想の核となる言葉が機械に掛けても出てこなかった。辞書に入れてある言葉なのにヒットしない。おかしいと思って調べると、原文のその単語の後にハイフン(-)が付いていた。なるほど原因はそれか。

実はハイフンに限らず単語の前後には色々なものが付いたり活用したりしている。その単語だけで登録していては、そのものずばり以外の変化形はヒットしない。そこで、ある言葉を自家製辞書に登録するときには、前後に付くものやその言葉自体の変化(活用)を正規表現にしてそれまで登録してしまうのである。それにより辞書検索時のヒット率が格段に高くなる。

正規表現を使った検索条件は様々な場合を想定して作ってあるが、ハイフンが付く場合を条件に入れていなかったので出てこなかったのである。それを修正しつつ、単語の認識率向上のためもう一度検索条件のうちの単語の前後に付くものや変化のパターンを見直すことにした。

ではどのようなパターンがあるのか。以前にもこの翻訳のサロンで概説しているが、ここでは単語の後のパターンについて少し詳しく説明する。単語の前のパターンについては別に説明する。

(i) まず複数形の処理を考えねばならない。英文法では名詞が複数形になるとsを付ける、esを付ける、yをiに変えesを付ける、f, feをvに変えてesを付ける、というような規則がある。例えばsの付いた名詞を認識させるにはどうするのか(以下では説明単純化のため単にsが付く場合のみ考える)。

(ii) 次に単語の後が区切りや文末になっていれば、カンマやピリオドが付いている。コロンやセミコロンが付くこともある。今回のように「-」が付いていることもある(なおハイフンには同じように見えても機械では別物と認識されるものが多数あるので、ここでは省略しているが注意しなければならない)。

以上の考え方を正規表現でどのように表現するかを秀丸で説明する。

まず (i) の複数形については、辞書にある単語の後にsが付くか付かないかである。その後の (ii) カンマ、ピリオド、コロン、セミコロン、ダッシュについては、付くか付かないかである。注意すべきは (i) と (ii) は、その順番で生起し、かつそれぞれが独立した条件であって、どちらかに内包されるものではない点である。

そこで、辞書にABCという単語があったときにはその後に
s?(\\.|,|:|;|-)を付加して

  ABCs?(\\.|,|:|;|-)

と書くことになる。s?は、sがあってもなくとも、の意である。(\\.|,|:|;|-)は、ピリオド、カンマ、コロン、セミコロン、ハイフンのいずれかという意味。ピリオドは正規表現で特殊な意味を持つのでそれ自身を表すときにはエスケープ記号\\を付ける。これらの要素が括弧()に入っているのは、置換のときにそのままで訳文に渡すのに必要になるためである。

(iii) ところで単語の後には普通は空白がある。空白があるから長い単語の一部を別の単語と誤って判断することがなくなる。例えばmilestoneをmileとstoneと判断したり、milesとtoneと判断するようなことが防止されるのである。

空白は、単語本体(sの有無はあるにせよ)の後に続くので、(ii) のピリオド、カンマ、コロン、セミコロン、ダッシュが単語本体の後に続くのと同じように考えられる。ということは (ii) に空白も含めればよいということになる。そこで

  ABCs?(_|\\.|,|:|;|-)   「_」は空白を示す

と書くのが、上に述べた単語の後の処理のまとめである。これで単語の複数形やその後に付くものについて次の12の変化を検索でヒットさせることが可能になる。

ABC_    「_」は空白を示す
ABC.
ABC,
ABC:
ABC;
ABC-

ABCs_    「_」は空白を示す
ABCs.
ABCs,
ABCs:
ABCs;
ABCs-

以上は説明単純化のため単にsが付く場合のみとしたが、実際の自家製辞書には名詞の複数形に、esを付ける、yをiに変えesを付ける、f, feをvに変えてesを付けるという場合も含めなければならない。また動詞の活用(三単現のsなど)、形容詞と副詞(fullとfullyなど)についても考えねばならない。さらに単語の前についても検討が必要である(前方一致の機能を使う)。これらについては別に書いてあるものや、これから書くものを参照されたい。

このような作業をする際に大切なのは、一つ一つの事例を丁寧に見ること、そこにある規則性を一般化すること、そしてそれを言語で表現してみることである。言語化が正規表現の一歩手前なのである。またヒット率を上げるためには単語帳を常に改定することも大切になる。単語自体の追加や見直しだけではない。ここに述べたような単語の前後の条件の追加や見直しも倦まず続けなければならない。

とはいえ完璧を求める必要はない。無いよりまし、少しでも手助けになればそれでよし、実用上差し支えなれば大出来くらいに考えることも大事である。

| | Comments (0) | TrackBack (0)

2016.01.03

括弧書き

外国人が日本の風習を研究して論文を英語で書いた。それを日本語に訳すという仕事がきた。そこにときどき括弧書きで日本人以外の読者の助けになる情報が書かれている。さてこれをどうするか。

括弧書きは読者のよく知らない事項について説明をして理解の助けにするものである。読者に自明なことは括弧書きにする必要はない。これを翻訳の世界に当てはめるとどうなるかを考えてみる。

(1)原文の世界でも訳文の世界でも余り知られていない事柄であれば、括弧書きはそのまま訳す。
(2)原文の世界では自明であるが訳文の世界では知られていない事柄であれば、原文にはなくとも括弧書きを添える方が読みやすくなる場合がある。括弧の替わりに訳注にするという手もある。
(3)原文の世界では知られていないことなので括弧書きがあるが、訳文の世界では自明の事柄であれば、原文にある括弧書きを訳す必要がないという判断をすることもある。

なぜそうするのかという原理を考え、そのうえで場合分けをすると答が見えてくる。冒頭の事例はこの3番目に該当する。日本人に日本の風習を改めて説明する必要などないからである。

もちろんこれがすべてではない。仮に英語の読めない日本人の学者がこの論文を査読するとなれば、外国人研究者の実力を判定するために括弧書きまで忠実に訳す必要があるかもしれない。しかしこの論文を一般の読者に読んでもらうということであれば、括弧書きを訳す必要はない。要は対象読者を考えてバランスをとるということになる。

| | Comments (0) | TrackBack (0)

2015.09.01

世界に影響される

今はある言語を使う人が世界中にいる。その言語を母語にしている人が各地に散ってそこで話すというだけではない。その言葉を母語としない人が移住してきてその言語を話すことがある。さらに母語の圏外にいながらその言語に影響を与えることすらある。そんな経験をした。

話はある文書に出てくる機械部品の訳語についてである。多くの部品の名称と規格はJISに定められている。対応する英語を日本語にするときにはJISにある表記を使うのが一般的である。

ところがある部品でJISの定めたものではない訳語が使われていた。検索をしてみるとこの訳語は中国の企業向け電子商取引サイト、アリババのページに出ている。しかもそれに類似のサイトが多数出てくる。それ以外では検索されない。

この文書を翻訳した人は、訳語を決定するにあたりアリババで使われている事例を一般的と思ったらしい。もう一歩踏み込んでJISを調べなかった。

アリババで拡散された誤訳がネットを通じて世界に拡散する。そして日本語を母語とする翻訳者ですらそれに影響されるという話である。

もっともアリババが最初に各国語に翻訳したときには、それぞれの言語を母語にする者に翻訳をさせた可能性が高い。とすればこの事例では元のアリババのサイトの翻訳に関与した日本人の誤りが、他の日本人による今回の翻訳の誤りに手を貸したということかもしれない。

純粋に一つの言語に限っても、誤用がいつの間にか主流派になるという話はよくある。性質としては昔からある話であるが、誤用や誤訳も世界規模になってくる。


| | Comments (0) | TrackBack (0)

2015.05.16

翻訳テキスト処理の効率化セミナー

5月17日(日)に東京ほんま会で翻訳テキスト処理の効率化についてお話する機会をいただきました。AHK、ワードマクロ、秀丸マクロなどを使い、トラドスなどの翻訳メモリーソフトやウェブ、テキストエディター等を横断してテキスト処理を効率化する工夫についてお話しました。構造解析、用語集の作り方、AHK等のマクロによるアプリケーション相互の連携法についての説明や演習もしました。

以下にそのときの資料を掲げます。どなたでもご覧いただけます。お役に立てれば幸いです。

「Presentation.doc」をダウンロード

「structural_analysis.MAC」をダウンロード

「line_swap.MAC」をダウンロード

「autohotkey_for_tkyo_homma_kai.ahk」をダウンロード

「example_for_tokyo_homma_kai.txt」をダウンロード

| | Comments (0) | TrackBack (0)

2015.05.12

テキストのアウトライン表示

翻訳作業にはテキストファイルで構造解析辞書と用語集を作り使っている。テキストファイルにするのはワードファイルに比べて処理速度が速いからである。

ただこの構造解析辞書と用語集のファイルが、新たなロジックを取り入れたり、単語を登録することで次第に大きくなってきた。それだけでなく、案件により微妙に処理内容が変わるため、両方とも頻繁に手を入れる必要もあるが、そのような作業で目的の行に到達するのに時間がかかるようになってきた。処理の干渉を点検するため、開いたファイルのあちこちを移動することもあるが、それもやや大変になってきた。

そこでアウトライン表示を活用することにした。テキストファイルを開くときには秀丸を使っているが、この2つのファイルを開くときにはアウトライン表示にするのである。それにより目的の場所に素早く行き着くことが出来る。

しかしアウトライン表示を活用するためには、処理の順番を考えながら類似する処理を一まとめにする必要がある。その作業は面倒なように思われるが、実は類似のものをまとめて眺めていると、ファイルの構成を変えたり正規表現処理を統一するなどの手直しのアイディアが浮かんでくる。アウトライン表示には、目的の場所に素早く行くというだけではない別の効用がある。

急がば回れ、順番にやればいいことがある。

| | Comments (0) | TrackBack (0)

2015.05.08

訳文を磨く

ある方から翻訳したものの一部をいただき、その中の次の文章についてやり取りをした。

------------------------------
An introspective, defensive, protective mood gradually enveloped Notre Dame as the clergy defended its exalted position against an encroching nobility and commons.
------------------------------
貴族や市民階級に地位を脅かされまいとして、高位聖職者が汲々とすればするほど、神経過敏な内向きの心理がノートルダム全体に広がった。


最初に「汲々とする」という表現におやと思ったが、考えているうちにその表現(文の綾)の話もあるが、文章の構造をどう作るかが大切ではないかと感ずるようになった。

そこで論理的な筋道を明らかにして
------------------------------
台頭する貴族や市民階級から高位聖職者が特権的地位を守ろうとしたため、ノートルダムは内向きの守りの姿勢をとるようになった。
------------------------------
という訳文を考えて提示した。


それに対してご返事があった。「汲々」という言葉を使ったのは、挙げられた一文がそれまでに述べたことを濃縮したような文章なので、読み手に少し立ち止まって欲しいと思われたからであるという。

その上で原文の接続詞の as について書いてくださった。as は因果関係を強く示しているのではなく、gradually と呼応する形で「~にしたがって、~につれて」という意味に訳す方がよいように思うと、ランダムハウスを引用しつつご意見を述べられた。

------------------------------
as(部分引用)
【3】…につれて,に従って:As one grows older, one comes to appreciate the little things in life. 人は年を取るにつれて人生の中でのささいな物の価値が分かってくるものだ.茵文語で so と相関的に用いることがある:As you go farther north, so the winters become longer and more severe. 北へ行けば行くほど冬は長く厳しくなる.
【6】…の時,の途端;…しながら(when, while よりも同時性が強い)【語法】:as you look away よそ見をしている間に.
------------------------------

原文の as に因果関係の意味合いがないわけではないが、書き手はいかにも歴史家らしく、客観的な事実だけを述べて、因果関係を示そうとしていない、「話の論理的な筋道を明晰にする」局面ではないと思うというのである。

この方もどちらかというと「道筋」を見つけたくなるタイプであるけれど、いろいろな原文をつきあうと、相手によっては「ここはぐっと我慢、そのほうがいい」と思うときがあるとも書いてくださった。


なるほど、as をどう考えるか。この言葉には「であるから(因果関係)」という意味もあるし、「につれて(同時進行)」という意味もあることから、この文章を同時進行を意識して訳してみた。

この文章に「につれて」という同時進行があるとすると、何と何が同時進行なのかを考える必要がある。進行するからにはそれは行為、つまり動詞またはその名詞化されたものである。ここでは3つの行為が挙げられている。

・ノートルダムの内向化
・高位聖職者の特権の維持
・貴族や市民階級の台頭

そのどれとどれが同時進行なのか。as の位置からすると同時進行は内向化と特権維持である。そのような解釈で訳文を作ると
------------------------------
台頭する貴族や市民階級から高位聖職者が特権的地位を守ろうとし、それとともにノートルダムは内向きの守りの姿勢をとるようになった。
------------------------------
という訳文もありかもしれない。勉強になった。


会話や対話をしていて楽しく意味深いものになる機会は以外に少ない。翻訳をする人たちの間での自主的な訳文検討もやってみると結構難しい(講師が添削するというのならまた別であるが)。その方もいろいろ試し、誰とでもうまく訳文検討ができるわけではないと思うようになったという。

しかし「それだけ翻訳という仕事は難しい、だからこそ面白い仕事でもある。それを広くわかってもらいたい、翻訳という仕事の価値を高めたいというのが密かな野望」であると書かれていた。そうでなくては。

| | Comments (0) | TrackBack (0)

2015.02.19

1対0の関係

言語が異なれば表現方法も変わる。単語レベルで考えても、同じような単語でもその意味する範囲が必ずしも同じではない。ベン図にすれば重ならないところがあり、異なる言語の単語同士が1対1に対応していないのである。

これを原文と訳文の単語の数に着目して表現すると、「原語の1語を数語に訳すことも、原語の数語を1語にすることもある」ということになる。

言い換えれば、原文にない単語でも訳文で付加する場合があるし、原文にある単語でも訳文で省略する場合があるという話である。それを数式にすれば

最初の例は
(1対1)× m +(1対0)× n と書くことができ、
次の例は
(1対1)× m +(0対1)× n と書ける。

この考え方は翻訳のチェックを自動化するときに重要になる。1対1だけではなく1対0または0対1を忘れないようにするということである。

つまり原文と訳文を比較し、訳文に対応する単語がなくとも、単純に訳抜けとは決められないのである。それが訳抜けなのか、考え抜かれて省略されたのかをよく判断する必要がある。逆に訳文に余計な単語が付加されているときにも、その単語はお節介ではなく必然で加えられたかもしれない。機械的にチェックする場合には要注意である。

対応するものが0であるということ、人間社会で何かに使えないか考えてみる。

| | Comments (0) | TrackBack (0)

2015.02.15

テキストの入れ替え

文章を書いていてテキストの前後を入れ替えたくなることがある。特に翻訳をしていると原文と訳文とでは語順が異なるので入れ替えがしばしば出てくる。

前には縦積みになっている2行または3行の入れ替えを紹介したが(こちら)、1つの行の中で前後を入れ替えたいこともある。以下には、カーソル位置を基準にしてその前後でテキストを入れ替えるコマンドを示す。例は秀丸のものであるが、考え方はワードでも同じ。

文末に句読点がある場合とない場合の2つの例を掲げる。

(1)文末に句読点などがあるとき
setcompatiblemode 0x0F;
disabledraw;
//論理行の行末まで選択
//範囲選択開始
beginsel;
//論理行末に移動
golineend2;
//一つ左に移動
left 1;
//切取り
cut;
//論理行の行頭に移動
golinetop2;
//貼付
paste;
endmacro;

(2)文末に句読点などがないとき
setcompatiblemode 0x0F;
disabledraw;
//論理行の行末まで選択
//範囲選択開始
beginsel;
//論理行末に移動
golineend2;
//切取り
cut;
//論理行の行頭に移動
golinetop2;
//貼付
paste;
endmacro;

要はテキストがどのように表示されているかを観察すること。今回はテキストを眺めていて、縦積みだけではなく1行の中での入れ替えもあると気付いたのである。

そのあとはいつもの如く、必要になる動きを細分化して記述する。記述ができればそれをプログラムにするのは簡単になる。

何かを達成したいというとき、大きく見ると同じことでも実際の状況は一つ一つが異なっている。とすればその状況に合わせた手段(道具)も毎回違う。そこで道具は個別にいくつも使い分ける必要が出てくる。またさまざまな道具を組み合わせて使う必要も出てくる。

(ただ行単位の入れ替え、一文の中での入れ替え、文末に句読点のあるなしでの違いなど、個別の状況に合わせた道具が増えてくると、それを必要なときにすぐに使えるように整理することが大切になる。思考や自分の作業手順に合わせながら、指の動きを最小にするようにショートカットキーを割り当てねばならない。)

| | Comments (0) | TrackBack (0)

2015.01.23

カンマの後の改行 前方不一致

英文テキストにカンマが入っている。そのカンマの後で改行したい。そのときには検索と置換を使うことになる。カンマを検索して、カンマの後に改行マークを入れたもので置換をすればいい。但しいくつか考慮すべき点がある。

まず、数字の間に入っているカンマの後では区切らないようにしたい。また、改行位置はカンマの直後ではなくカンマの後の空白の後にしたい。

以上の条件で秀丸を使った改行の方法を考えてみると色々な解法がある。

(1)カンマの前に注目すると、数字でない文字とカンマの組合せと考えられる。数字以外は[^0-9]{1,}という正規表現となる。但し秀丸はそのままでは最長一致で検索するので、?を付加して最短一致の検索に変える必要がある。次のコマンドで数字でない文字とカンマの組合せを検索し、それに改行マークを付加したもので置換が行われる。
replaceallfast "([^0-9]{1,}?), " , "\\1, \\n" , regular, nocasesense, inselect, nohilight;

(2)秀丸には前方一致、前方不一致、後方一致、後方不一致という便利な機能がある。そのうちの前方不一致を使えば、前が数字以外のカンマだけを検索するので最短一致を考える必要がなくなる。知っておいて損はない。
replaceallfast "(?<![0-9]), " , "\\1, \\n" , regular, nocasesense, inselect, nohilight;

(3)発想を変えカンマの後に注目することもできる。実はカンマと空白の組合せを探せば普通は十分である。
replaceallfast ", " , ", \\n" , regular, nocasesense, inselect, nohilight;

しかしこれで動かないようなテキストがあるので、上の2つの解法も紹介したのである。同じことを実現するにしても、色々な方法がある。

なお、うまく動かないとき暫くそのままにしておくと、あるときふと別の解法が思い浮かぶことがある。科学史に色々な例が出てくる発見と同じ。

| | Comments (0) | TrackBack (0)

2015.01.12

船に刻む

わかりにくい英文の校正の仕事も漸くにお仕舞いとなった。112ページの契約書には、一文が200語を超えるという事例が頻出した。この商業契約書を作成したランカシャーの弁護士、どうしてこのような文章を作るのかしら。

難解な英文に付き合いながら、わかりにくいのは何故なのか、どうして長くなるのかと、彼の考え方をあれこれ想像した。それは彼の書く英文の特徴を捉え、そこから何らかの法則を見つけようという試みである。

法則がわかれば今回の翻訳が捗るばかりではなく、将来似たような文章に遭遇したときにも役立つ。そう考えると、この仕事が難解な文を延々と翻訳するというものから、別種の面白い発見の作業に変わった。

その文章は一文が非常に長く、内容提示の順番が論理的でないこと、修飾節と修飾されるものとの距離が離れ過ぎていることを前回問題にした(わかりにくい原文)。しかし校正をやり終えて検討しなおしてみると、それ以外にも問題があるように思う(末尾に236語の文例を付すので試していただきたい)。

長い文章はどこにもある。しかし長くなるときにはそれなりの工夫がある。

例えば日本の税法やその下位の政令や施行令など一文がかなり長い。無作為に法人税法施行令第16条第1項第6号を取り出してみると、673字あった。英文なら300語はあるであろう。

これは要件を示す条文であるが、最初に主文を「見込まれていることと」として出し、括弧書きでも「○○の場合には・・・見込まれていることとする」という表現を繰り返し使い、場合分けの文章構造が頭に入るようになっている。

それに対してこのわかりにくい文章では、一文の中にarising(に起因して)、by(により)、for(のため)、in relation to(に関し)、whether(を問わず)などを用いた修飾節や条件節が規則性なく詰め込まれている。そのために各項目の確認がしにくくなっている。長い文章をわかりやすくするには何らか工夫が必要になるのである。

どのような工夫をすると良いのか。それは整理といっても良いし、まとまりという表現もできるし、規則性としても良いかも知れない。

(1)まず箇条書きを使うという方法がある。箇条書きは様々な項目を手短かに明らかにしたいときに便利である。

上記のarising(に起因して)、by(により)、for(のため)、in relation to(に関し)、whether(を問わず)などを箇条書きにするだけで、内容が理解しやすくなるはずである。

(2)また並列を活用すると理解しやすくなる。似たようなものを列挙するときに表現を揃えるのである。法人税法施行令では「見込まれていること」を4回、「○○の場合には」という場合分けの表現を3回使い並列を意識させていた。

それに対してこの契約文では事項列挙に、その発想がなかった。例えば列挙されるものの品詞が揃っていない。あるものについては名詞、別のものは動名詞(この二つの混在はまだ許容できるが)、さらに別のものは不定詞を伴う文節で書かれている。

また思考の長さも揃えられていない。つまり「○○の○○、◎◎の◎◎、△△の△△」とすれば理解しやすいが、「○○の○○、◎◎、△△の△△の△△」というように、あるときには単語が単独で使われ、別のときにはそこに修飾を伴い、さらには複数の修飾がなされるなど、列挙のレベルが違う。

(3)また標準的な英語の構造を活用するということもある。

英語では一文の中で、意味の一まとまりが列車の客車のように連なる。最初に主語と述語の機関車があって、その後に目的語や補語が客車のごとく連なる。長い修飾節、条件節、従属文なども関係代名詞や接続語を連結器として客車になる。最初の主語と述語で大枠は押さえてあり、そのあとに提示する要素が思考の順番になっていれば論理が曖昧になりにくい。

しかし彼の英文は、標準的な英語の構造を無視して、主文が長すぎる。主題を簡潔に提示して、あとは補足に回せば良かったのである。主語を別のものにすれば、ごく普通の連結列車になったはずである。

わかりにくさは文章構造が英語とは異なる日本語に翻訳されときにはさらに増幅される。

日本語では主語を提示した後は、目的語や補語など色々な要素が間に挟まり、最後に述語が来る。主語と述語が離れているので、文章が長くなると最初の主語が何であったか忘れてしまうのである。それが複文になると(主語1(主語2(主語3述語3)述語2)述語1)となり、主語と述語の対応関係をさらに複雑にする。いわばロシアのマトリョーシカ人形のように入れ子になっているのである。

わかりにくい英文を、連結型構造から入れ子型構造に直して日本語にするので、出来上がった文はさらにわかりにくくなる(まあ、それを克服する手段は様々にあるのであるが)。

一つずつ文を見ていると、この弁護士には文章を書いているときに枝葉に目が行ってしまい幹を忘れてしまう傾向のあることが見えてきた。

幹を見るとは、修飾節を外し、或いは条件節を取り除いたときの、主語と述語の対応関係を常に把握しておくということ。それは主文と従属節とがある複文でも同じ。

この人は文章を書いていて、修飾節や条件節を書き出すと関心がそちらに移ってしまい、主文のことを忘れてしまうのではないか。一つの主題を終える前に、次の主題を始めてしまうといっても良い。文章が長くなるのは、そのようなことが原因になっているのではと考えた。

これは方向や方角の把握が不得意な人に似ているかもしれない。方向音痴の人は、場所を記憶するときに動いている車や人に注意が向いてしまい、不動の建物や地形や東西南北を押さえられないと聞いたことがある。それと同じように、文章を作るときの根幹である主語と述語を把握せず、枝葉の修飾節や条件節に注意が移ってしまうのである。

方向音痴の人や、興味が移り一つの文を閉じることができない人は、剣を落として動いている船の縁にその場所を刻んだという中国の故事の人と通うものがあるのかも知れない。

ではどうやって訳すのか。

結局、頭から訳して意味の区切れるところで強制的に文を閉じてしまう、というのが解決法である。強制的というのは原文に表現されてはいないが、書き手の頭の中には想起されているであろう単語を補うということである。曖昧な原文では正確な翻訳はできない。とすればできるだけ明晰にすることを試みるというのが、とるべき道であろう。

以下に236語の文例を付す。

Within one month after the date of any and every permitted assignation transfer grant of a standard security charge sub-lease or tenancy agreement (including any immediate or derivative tenancy agreement of the whole of the Leased Premises) for any term or the Grant of Confirmation or other matter disposing of or affecting the whole or any part of Leased Premises or transfer of title to the same to give or procure to be given to the Landlord and its Managing Agents notice in writing of such disposition or transfer of title with full particulars thereof and also at the same time to produce or cause to be produced to them a certified copy of the document effecting or (as the case may be) evidencing such disposition or other matter and to pay or cause to be paid at the same time to the Landlord and its Managing Agents such reasonable fee (not being less than £XXX plus VAT) appropriate at the time of registration in respect of any such notice perusal of documents and registration affecting the Leased Premises AND PROVIDED THAT in the case of contemporaneous transfer and grant of standard security the fee shall only be payable in one of such matters and failure to do so will make such assignation transfer grant of standard security charge sublease or tenancy agreement voidable at the instance of and pursuant to a notice from the Landlord

| | Comments (0) | TrackBack (0)

2015.01.03

わかりにくい原文

ある商業施設の賃貸借契約書が翻訳されていて、その校正の仕事が回ってきたが、思いがけず時間がかかっている。かなりの分量があるというだけではない。出来上がったものは一応日本語で書かれているが、読んでみても全く頭に入らず、一文を点検するのにも随分時間がかかるのである。

それは何故なのか。原文の問題、訳文の問題が重なっているが、根本的な原因は原文の側にありそうである。

まずは原文の内容の問題がある。この賃貸契約書はスコットランドの法制を前提に書かれており、その考え方や術語を頭に入れ、何の話をしているのかを理解しないと誤訳になる。辞書をひいただけでは単語の意味を確定できない。

例えばIrritancyという単語には、大きな辞書では刺激性という訳語が充てられているが、法律に刺激性ではおかしい。最終的にはスコットランド1985年改正法(雑則)の中の賃貸借に関する条文を当たり、契約解除であることを確認しなければならない。

さらに最近これに関して注目すべき判決が出ていて、それが契約書の文言にも反映している。従ってその判決文や解説も目を通さねばならない。翻訳をされた方は相当に苦労したと思うが、やや調査が足りなかった。

内容ではなく、原文の表記の問題もある。例えば類似のものを併記するときに必要なカンマがない。そのため英語がわかりにくくなっている。まあ慣れればそれでも対処できるが。

もっと問題なのは、一文が長いことである。ある文に含まれる単語を数えると236語もある。一般に読み易い英文は20語以内と言われていることからすると、これは長すぎる。文末に辿り着いたときには、冒頭で言われていたことを忘れている。あちこちの法文や契約書から類似表現を寄せ集め、気がついたらこれだけの長さになっていたのかもしれない。

しかし長い文章でも書き方次第では、正確に理解してもらえる。なかなか句点の出てこない江戸時代や明治初期の文章も、思考の順番に書かれていれば正確に読むことができる。一文の中は一種の連結列車のようなもので、文節要素が客車のように繋がっている。それが思考の順番に出てくれば、長文でも問題なく理解できるのである。それはどの言語でも同じこと。

そういう意味では、この契約書の英語の一番の問題は、各要素が提示される順番がよく考えられていないことである。英文は一般に最初に中心になる言葉を出し、そのあとで関係代名詞を使い補足的な情報を付加していくことが多いが、その連結車両の順番が何となくおかしい。また修飾節が修飾されるものと離れたところに出てくるので、これも理解を困難にしている。

正直のところ、これほどに長くかつわかりにくい文が頻出する契約文書にはなかなかお目にかからない。翻訳をした方は相当苦戦されている。出来上がった訳文は当然ながら何を言っているのか分からない。結局もう一度訳しなおすということになり、年末年始はこの手直しで終わろうとしている。


| | Comments (0) | TrackBack (0)

«AHKによるテキスト受け渡し