目次

ご覧になりたい項目をクリックしてください。読み終えたら、各ページの最初にある Main をクリックするか、ブラウザーの戻るボタンでこの目次に戻り新たな項目をご覧ください(・は工事中)。

最新記事


括ってから広げる

*翻訳の考え方
はじめに・

原文の構造解析1
原文の構造解析2
原文の構造解析3
原文の構造解析4
動詞活用の正規表現
並列の意識 政策文書を例に
原文から訳文へ・
ワードから秀丸を動かす1
ワードから秀丸を動かす2
訳文の縦積翻訳1・
訳文の縦積翻訳2・
訳文の縦積翻訳3・
転記か削除か
検索置換による翻訳
重複処理の防止
正規表現を使った翻訳のマクロ
翻訳テキスト処理の効率化セミナー

*AHK編
AHKによるテキスト受け渡し

*秀丸編
テキストのアウトライン表示
秀丸間の移動
文字固定 特殊文字利用
同じ文字列の扱いを変える
カンマの後の改行 前方不一致
計算して置換 和暦西暦の換算
単語の認識
区切り防止
統一 /と%(秀丸)
統一 括弧(秀丸)
行の入れ替え
テキストの入れ替え
選択して文末移動

*ワード編
翻訳効率向上のためのワード活用法(入門編)
文字固定 書式利用
引用符の個別指定
入替 行
統一 /(ワード)
統一 括弧(ワード)
括弧1 括弧の表記法
括弧2 検索置換
括弧3 正規表現(1)
括弧4 正規表現(2)
括弧5 正規表現(3)
括弧6 正規表現(4)
括弧7 正規表現(5)
翻訳の正規表現 セミナー資料

*翻訳あれこれ
括ってから広げる
「てにをは」と文章の肥痩
部分と全体
語釈を作る
切ってつなぐ
段取り
括弧書き
世界に影響される
訳文を磨く
1対0の関係
船に刻む
わかりにくい原文
数字の日本語表記
敬語表現
形式ではなく内容を移す
語順の入れ替え
なぜ変わらないのか
組織名の英語表現から
懐かしき山や川

| | Comments (0) | TrackBack (0)

2017.03.15

括ってから広げる

本を読んでいて議論が込み入ってくると、内容が頭に入りにくくなる。そこで何を言いたいのか理解するため大きな概念で一度括ってみる。例えば方向性を捉えてみるのも一種の括りである。これは上を向いているのか下降しているのかと。

それがわかると先に進みやすくなる。また括りという作業をしていると、同じ概念に属す表現にも様々なものがあることにも気が付く。

読んで理解するだけであればそれで良いが、これを別の言語に移すときには、もう一つ工夫がいる。大きな概念で括るのは良いが、このままにしていると表現が単調になる。そこで今度は表現を広げるのである。

そのときは移し替える先の言語で、どれだけ語彙を持っているかが大切になる。普通は自分の母国語に直すのであるが、そのときは子供のときからどれだけ読書をして自らの詞藻を豊かにしてきたかが問われる。

原文の多様な表現をそのまま訳せば、訳文が痩せることはないのではないかと考えるかもしれない。まあ外国の表現が取り込まれ、その国の言葉が豊かになることもある。ただ舶来のものが馴染むには時間がかかる。

それにどの言語にも特有な表現がある。それを単語の置き換えに終始して翻訳すると、違和感のある文やおかしな文章になってしまう。

日本語であれば、万葉や祝詞の和語からはじまり、長い年月をかけて自国のものになった漢語という資産もある。お母さんが子供に話す優しい響きもある。それを活かさない手はない。

括っただけでは骨組みばかりの文章になるし、逐語訳では妙な文章になる。広がっているものを一度括って、それからもう一度自分の言葉で広げることで訳した文章が生きたものになる。

| | Comments (0) | TrackBack (0)

2017.03.13

「てにをは」と文章の肥痩

・・・日本語は「てにをは」なしには存在しない言語である。西欧の言葉に訳された自分の詩を読むと、そのことを強く意識する。そこにあるのは確かに自分自身の詩の訳というものなのだが、日本語の原詩と並べてみると、まず例外なしに西欧語訳の方がきびきびした直進性を備えている。・・・

こう書かれたのは大岡信さんである(うたげと孤心)。もう少し大岡さんの言葉を引用する。

・・・「てにをは」の部分の繊細な表情はあらかた姿を隠し、代わりに名詞や動詞の働きの比重が大きくなり、その分だけ詩の骨組み、構造が明確に印象づけられるようになっている。・・・

大岡さんの詩は英語、オランダ語、フランス語、ドイツ語、中国語、スペイン語、マケドニア語に訳されているというが、上の引用はそのような翻訳をご覧になっての実感であろう。

これらのヨーロッパの言葉では名詞、動詞を中心に構造が明確であるとの指摘はそのとおりであるが、日本語では「てにをは」の部分の繊細な表情が大きな役割を果たしているというのは(特に詩歌において、というべきかもしれないが)、指摘されないと気付きにくい。しかし考えるほど、重要な指摘であると思うようになってきた。

この違いが何に由来するかは簡単には答えられないので、一先ず措いて置く。しかしその違いがヨーロッパの言語と日本語との間を往復するときにどのような影響を与えるのかは、ある程度見当がつくかもしれない。それが明らかになれば、翻訳をするとき、さらに広く異文化の橋渡しをするときに役立つ。それを「てにをは」から考えてみることにする。

「てにをは」とは助詞・助動詞・接尾語に用言の語尾を含めた汎称であるという。他言語の後置詞、接続詞に当たるという説明もある。

ヨーロッパの言葉には前置詞があり、その前後の単語との関係を示す点では「てにをは」似ているところがある。ただ「てにをは」と前置詞とでは品詞の役割やカバーする範囲が異なっている。前置詞は多分に機能的なものにとどまるが、「てにをは」は繊細さや情緒性を付加するという機能も併せ持つのである。

ただこれは前置詞が「てにをは」に劣るという話ではない。言語により品詞の区分が異なるし、同じ品詞の単語であってもその指し示す範囲は異なるが、どの言葉でも精妙なものの言い方はできる。名詞や動詞の使い分け、助動詞を活用した仮定法や過去完了、あるいは多様な形容詞や副詞を使うなどの工夫で、どの言語でもどのような表現も可能であろう。

大切なのは、各言語による品詞区分や役割の違いを十分理解したうえで翻訳をするということ。

その工夫を示せば
(1)同じ品詞であっても違う表現を使う
(2)品詞変更。動詞の名詞化、形容詞の動詞か、名詞の形容詞化など
(3)原文にない表現を付加する
(4)原文にある表現を取り除く
(5)表現の順番を変える
(6)文章の構造を変える
など様々なことが考えられる。

「てにをは」については、単なる前置詞的な機能のほかに情緒性も含まれているが、ヨーロッパの言語にその両方を含む品詞が存在しないとしたら、それを翻訳するときにはいくつかの品詞に分けて表現するなどの工夫が必要になる。

以上のことを念頭に置いて、外国語に翻訳された大岡さんの詩に対する彼自身の印象ついて考えてみる。大岡さんは次のような印象を持たれた。

・例外なしに西欧語訳の方がきびきびした直進性を備えている。
・名詞や動詞の働きの比重が大きくなり、その分だけ詩の骨組み、構造が明確に印象づけられる。

そのような印象は、言語による違いなのか、それとも翻訳により形成されたものなのか。その翻訳において、上に述べた「てにをは」の情緒性付加の機能はどこまで理解され、訳された詩にどれだけ反映されていたのであろうか。これは大岡さんの詩に限らず、日本の詩歌の翻訳全般について当てはまる問題である。

このような疑問を持つようになったのは自分で翻訳をするようになってからである。正確でありながら、無味乾燥とならず自然で情緒を喚起できるような表現力をどのようにして身につけられるかと悩んでいる。それは外国人の翻訳者も同じではないのか。

特に言語表現の精髄ともいえる詩歌、それも外国語(日本語)の詩歌を外国人が母国語に翻訳するときに、日本語の「てにをは」に含まれる情緒性をどれだけ表現しえているのかと疑問になった。外国語にするときにそのような困難は乗り越えられているのか。

例として、以下に大岡さんの「折々のうた」を長いこと英語に訳されているジャニーン・バイチマンさんが、太田垣蓮月の和歌をお訳しになったものを引用させていただく(大岡信ことば館のホームページに掲載)。

  山里は松の声のみききなれて風ふかぬ日は寂しかりけり

  は

  In the mountain village
  my ears know only
  the voice of the pines -
   windless days
  are lonely

  と訳されている。

訳されたものはダッシュで区切られた2つの文章からなり、西洋の詩のように文の途中で改行されている。体裁は和歌を区切って書くやり方と通うものがある。英訳は簡潔で骨組みが確実に訳されている。大岡さんがご覧になったのも、これに似た、「てにおは」に含まれる情緒性を捨象した骨組みだけであったのではないか。それが「きびきびした直進性」と感じられたのではないか。今はそう考えている。

細かく見ていくと「風ふかぬ日は寂しかりけり」の部分が「windless days are lonely」と訳されている。日本語では「寂し」「寂しかり」「寂しかりけり」では表情が違ってくる。英訳はこのような日本語の差をどのように捉えたのであろうか。詠嘆は訳出されているのか。正直なことを言えば、そこに何らかの情緒を加える表現を追加してもいいのではないかと感じるのである。

このような翻訳が生まれるのは、「てにをは」がない国の人にはそれがわかりづらいうえに、情緒や詠嘆の表現の難しさが加わって、文の論理を正確に訳すことに注力したからかもしれない。

しかしそれでは翻訳されたものが痩せてしまう。翻訳は原語の骨格に忠実というところに留まらず、ときには自国の言語にある表現を使い、訳者の解釈を大胆に示してもいいかもしれない。原文の論理を忠実に写し取っただけでは、翻訳を重ねるほどに原文の豊かな意味が失われていくことになる。解釈を誤ることもあるので冒険でもあるが、文章を豊かなものにするために賭けてみる価値があろう。それは自らの責任の取り方でもある。

以上はヨーロッパの言語を母国語としない者の感じたことである。間違っているかもしれない。どこの言語にもその言語環境で育った者にしか理解できないものがある。その言語で育った人に何事かを想起させる独特の表現がある。原文の意味は訳文の雰囲気の中に織り込まれ、この表現で十分なのかもしれない。

訳しているときには常に自問している。果たしてこの表現の背後にある雰囲気なり歴史風土社会を自分は本当に把握しているのかと。謙虚にそれを一つひとつ確認していくことで訳文は豊かになっていく。「てにをは」を外国語に移すことに関していえば、それは主としてその国の言葉を母国語とする人の仕事であろうが、論理的なつながりを訳すだけではなく、失敗を恐れることなくそこに込められた情緒を表現してみてくださいとお願いしたい。

(大岡さんの著作を読むようになったのは20代半ば以降であるが、母校の先輩として存じ上げていた。母校での講演にみえた大岡さんと応接でお話をした覚えがある。そんなこともあって近しい気持ちで、書かれたものを読み返している。)

| | Comments (0) | TrackBack (0)

2017.02.15

計算して置換 和暦西暦の換算

日本語の文書を英語に翻訳するときに文中にある和暦を西暦に直さねばならないことがある。昭和20年8月15日を15 August, 1945(表記は英米でまた時代により多少違いはある)とするようなときである。

これを機械にやってもらうにはどうしたらよいか。検索と置換を使うのであるが、単に数字を転記し年月日の順番を入れ替えるだけでは年が合わなくなるので、年数の計算が必要になる。例えば昭和であれば、その年数に1925を加えて西暦とするという操作が要る。

置換のときに一緒に計算をすることができれば便利であるが、テキスト処理のエディターにはエクセルのような関数がない。さてどうするか。

仕事にはテキストエディターとして秀丸を使っているので、そのサポートフォーラムに相談をしてみた。残念ながら、replaceallの一回の置換での数値演算はできないという。

しかし検索された文字列を取得してから計算し、その計算結果を挿入するという方法を秀丸担当さんからお教えいただいた。そのマクロは以下の通りである。

setcompatiblemode 0x20000;
disabledraw;
gofiletop;
$s="昭和([0-9]{1,2})年";
while(1){
searchdown2 $s+"(?\\1)",regular;
if(result==false) break;
$found=gettext(foundtopx,foundtopy,foundendx,foundendy);
replaceup $s
,str(val($found)+1925)+"年"
,regular;
}

これを使うと昭和で記されている和暦が西暦になる。平成なら上記のスクリプトの1925の部分が1988となる。

なお和暦の表示が明治大正昭和平成ではなく、明大昭平であったりMTSHになっていることもあるので、実務で使うときには、上のスクリプトの検索条件を案件に合わせて変更したり、最初から何種類も用意しておく必要がある。1つ作ればすべてが賄えるわけではない。それは置換後の英文表記についても同様である。

年数の西暦換算だけなら以上であるが、年月日まで完全に置換で翻訳したければ、もう一度検索置換をする。上のマクロで昭和20年を1945年に直したうえで、1945年8月15日という文字列全体を対象に、従来通りの検索置換を行い15 August, 1945に直すのである。そのスクリプトは次の通り(これは1月用。2月から12月も同じように用意しておく。西暦1000年以降について対応)。

replaceall "(1|2)([0-9]{3})年1月([0-9]{1,2})日", " \\3 January, \\1\\2" , regular, nocasesense, inselect, nohilight;

処理の対象が年月だけの場合のスクリプトも加えておく。こちらについても12か月分必要になる。

replaceall "(1|2)([0-9]{3})年1月", " January, \\1\\2 " , regular, nocasesense, inselect, nohilight;

これで当初考えていた「置換の際に数値の計算をして、和暦西暦の換算のうえ、翻訳する」という作業をすべてパソコンに任せることができた。

以上、同じようなことをお考え方の参考になれば幸いです。またこれをお教えくださった秀丸エディタ&関連ソフトサポート会議室の秀丸担当さんに感謝します。

| | Comments (0) | TrackBack (1)

2017.02.13

部分と全体

翻訳をするときには余り小さく区切って全体を見失わないようにと注意される。段落全体で何が語られているかを理解し、前後の文章を把握し、その文脈の中で訳す必要がある。さてそれは部分とどのような関係になっているのか。全体観を得るにはどうしたらよいのか。

(1)考えてみると全体観はいきなり得られるものではない。まずは細かく区分されたもの(それは単語のことも熟語のこともある)がどのような意味なのかを正確に理解することから始まる。辞書を引くのはそのためである。場合によっては手書きの文字の解読から始まることもある。

(2)そのうえで、その区分されたものが他の小区分とどのような関係にあるのかを考える。例えばその単語なり文節が、他の単語や文節と対比したときに、並列なのか、順接なのか逆接なのか、装飾・被装飾の関係にあるのかを理解する必要がある。

他の単語との関連を検討したうえで、辞書にない表現を考える必要も出てくる。単語が熟語の中で使われると意味が変わる場合があるのも、このような関係性を勘案するからである。

(3)そのような部分の確認作業をした後に初めて、区分されたものが一つの文章の中でどのような位置付けになっているのか、前後の文章や段落との関係で辻褄が合っているのかを考えることになる。筆者の言いたいことが読み手の中である程度まとまった形で姿を現すようになるのは、このような手順を踏んでからのことである。

訳文を作っていく際に全体の中での均衡を吟味し当初の理解で良いのかを検討するのは、この段階の話である。その前の検討を飛ばしてはいけない。

(随分前のことになるが、欧米諸国が国際データ流通(Transborder Data Flows)を問題にしたことがあり、米国議会の立法の動き追ったことがあった。そのときに米国の文献にsun setという言葉が出てきて、20代半ばの自分はサンセット法と訳した。個別の単語に捉われて全体観を得ることがうまくできなかった例である。今なら時限法と訳すであろう。)

部分と全体は密接につながっている。どちらか一方では不十分。全体観を大切にという議論はもっともであるが、それは「各部分を丁寧に確認する」ことを前提にしての話である。部分を確認しつつ、次第に浮かび上がる全体像を見ては、部分に戻ってそれを修正する。その繰り返しにより全体の像が明瞭になってくる。全体観が単独にあるのではない。

それは訳文を作るときも、自分の文章を書くときも同じ。部分と全体の両者を往復しなければ首尾の整った文章は書けない。その往復により自分の思考が少しずつ明晰になってくるのである。

| | Comments (0) | TrackBack (0)

2017.01.29

並列の意識 政策文書を例に

何かを言おうとしたとき、同列のものがあれこれ思い浮かぶことがある。それを表現するときには並列を明らかにする工夫がいる。工夫は漢文の四六駢儷体や対句、日本の和歌や長歌、日常の慣用句や歌謡など、さまざまなところに見られる。その事情はどの言語でも同じである。

では並列の工夫とはどのようなものか。文章の中で並列になっている状況を観察すれば、並べられているものは文節であることも、動詞であることも、形容詞や副詞であることもあるが、そこで大切なのは同じ品詞、同じ文法構造に揃えることであるというのが見えてくる。そのうえで欲を言えば似た音韻、内容的にも同類か近類にすれば趣も出てくる。

詩歌などは別にして、日常的な散文や実用的な文章では並列を明らかにすれば、読者が理解しやすくなる。例えば上の「並列は文節であることも、動詞であることも、形容詞や副詞であることもある。」という文では、「あることも」を繰り返して、同列の要素をわかりやすくしている(しかし同じ表現を機械的に繰り返すのではあまり芸がなく、適度な変奏があった方が楽しいが)。

上に述べたことは書くときの注意であるが、読むときにも同じような意識を持てば誤読が少なくなる。動詞の並列や形容詞の並列に着目してみる。そのうえで意識を視覚化すればさらに理解が楽になる。

実はこれが翻訳のうえで役に立つ。並列を意識することが、正確な原文理解とその先の縦横変換で力を発揮するのである。例えば政策文書。抽象度の高い言葉遣いで、ともすると理解が上滑りになる。促進、奨励、誘導、振興、持続的、重点的、連携的、ガバナンスなどお役所言葉満載となる。

そのときには、書かれている文章の中に、並べられている概念がないかを探してみる(ときには品詞変換が必要になるが)。見つかったらその並列項目を箇条書きにする。お役所文書をそのまま使うわけにはいかないので、上の例の文章を使ってやり方を示せば、次のように区切るのである。

  並列は
  文節であることも、
  動詞であることも、
  形容詞や副詞であることも
  ある。

ここまですると、正確な理解ができるだけではなく、縦横変換(翻訳)もやりやすくなる。

幸いにして今の文書はすべてテキストが電子化されている。そこで並列概念に着目して文書を区切って縦積みにする。区切るのは手でするのではなく、機械にやってもらう。区切る部分を正規表現を使って指定し(上の例なら「ことも」という文字列に着目)、それを構造解析辞書に組み込む。そのうえでマクロを実行すれば文章が区切られる。こうすれば並列概念が簡単にわかるようになる。

原文が日本語でも外国語でも考え方は同じ。これで作業の効率が格段に良くなる。

| | Comments (0) | TrackBack (0)

2017.01.20

動詞活用の正規表現

動詞をその活用形まで含めて検索するにはどうするか。一番簡単なのは、それぞれを順番に検索することである。まずはそれが出発点。しかしもう少し頭を使ったやり方はないものか。そこで正規表現を使うことになる。

ではどのような正規表現を書けば良いのか。例えばlisten、listens、listened、listeningをすべて検索することを考える。

これを観察すると、原形、原形+s、原形+ed、原形+ingというパターンになっている。しかしこれらは並列の関係ではない。まずは言葉で表現してみると、これは「原形だけ、または原形+s もしく原形+edもしく原形+ing」という形である。それを論理式で書けば
  (原形だけ) or ((原形+s) or (原形+ed) or (原形+ing))
となっていて、入れ子構造であることがわかる。ここまで分解すれば正規表現を書きやすくなる。

活用を含めlistenをすべてを検索する正規表現は秀丸なら
   listen(s|ed|ing)?
となる。listenを検索するが、そのあとにs、ed、ingのいずれかが付いても付かなくてもいい、という意味である。

次にcombineという動詞はどうか。combine、combines、combined、combiningであるが、前のeatとは活用パターンが違う。活用するときは末尾のeを外してから活用形を付ける。

原形を出発点にするとeの処理のため正規表現が複雑になり、2段階処理をせざるを得なくなる。そこでcombinまでを仮の原形と考えて正規表現を作る。

論理式を書けば
  (仮の原形) and ((e) or (es) or (ed) or (ing))
であり、正規表現は
  combin(e|es|ed|ing)
となる。これは上記の例と違い正規表現の末尾に?が付かないことに注意。仮の原形のあとには括弧の中のいずれかの要素が必ず続かねばならないからである。

さて、このような考え方を何に使うのか。活用する動詞の一括検索の主たる用途は、英文の構造解析である。動詞の前後で区切り、その動作を明らかにすると共にあとに続く目的語との区別をするときに役立つ。

上記2つのパターンを構造解析辞書に組み込むだけで、かなりの比率で動詞を検索できる。残りは手作業でやっても十分である。構造解析についてはこちら(原文の構造解析1)。

今はさまざまな形態素解析エンジンがあるが、それを使うよりもまず自分に必要な部品だけ作ってみて、それを少しずつ改善していく方が、仕事がやりやすくなるように思える。

| | Comments (0) | TrackBack (0)

2016.10.29

同じ文字列の扱いを変える

今の日本語文書には漢字・平仮名・片仮名だけではなく欧文が普通に使われるが、そのような日本語を電子機器で入力していると余分な文字や半角の空白が文書に残ることがある。これを取り除くにはどうするか。

例えば半角の空白が文書の中に紛れていることは結構ある。それを削除するには、ワードやエクセル、テキストエディターなどのソフトに検索置換の機能を使う。半角空白を検索して置換後の文字列に何も入力しないという操作を行うのである。

これは単純な例であるが、さらに検索置換に正規表現を使うと、個別の文字をいちいち指定することなく一定の文字列を全て検索して削除することができる。例えば全角文字の中にある半角の英文字や空白を取り除くときには、秀丸のスクリプトなら
replaceallfast "([a-zA-Z ]{1,})", "" , regular, nocasesense, inselect, nohilight;
とすればよい。これによって全角文字の中にある半角の英文字と空白が全て削除される。

しかし日本語の文書であっても人名、組織、略語、書籍、論文などを欧文のまま残すことがある。文書の中にあるOECDという組織名、あるいはJames Watsonという人物名はそのままにして、それ以外の英文字を削除したいというような場合である。

上に掲げた正規表現では、残したい文字や半角もすべて削除されてしまう。同じ文字でも削除するものと残すものとを区別するにはどのような正規表現を書けばよいのか。それが今回の課題である。

これを実現するには、残したいものに標識を付けておいて、それ以外のものを削除するという2段階操作をする。

まず標識を付けるのであるが、ここでは標識にすみつき括弧を使ってみる。つまり残したい文字列の部分を【OECD】あるいは【James Watson】のようにするのである。

その次の段階で削除をするのであるが、最初はその論理を普通の言葉で表現してみる。実現したいのは
  和文の中にある英文字と半角空白を削除するが
  すみつき括弧内の英文字と半角空白は削除しない
ということになる。

単純化すれば
  ○○を削除するが
 【○○】は削除しない
である。つまり【○○】という形になっていない○○を検索して、置換後の文字列に何も入力しない、ということになる。

この検索を分解して表現すると、
  ○○の前に【がなく
  ○○の後に】がないときの
  ○○を検索する
ということである。

ここまで来ると実現したいことを正規表現にするまであと一歩になる。

前に【がない○○を検索するためには、前方不一致という条件式を使う。ある文字・正規表現の後に、別の文字・正規表現を指定したうえで、前方部分がないときの後方部分だけ検索することができるのである。条件式は?<!である。

後に】がない○○を検索するには、後方不一致を使う。ある文字・正規表現の後に、別の文字・正規表現を指定し、後方部分がないときの前方部分だけを検索するという条件式で、?!と書く。

これを使うと検索式は
  (?<![【a-zA-Z ]{1,})([a-zA-Z ]{1,})(?!】)
ということになる。

この正規表現の検索式を普通の日本語に翻訳すれば、前に【や英文字や半角空白がなく、後に 】が続かないときの英文字や半角空白を検索する、という条件である。ここですみつき括弧【を[ ]の外に出さずに[ ]の中に入れたのが味噌。

これですみつき括弧に挟まれていない英文字と半角空白を削除できる。つまり同じ文字列でありながら、すみつき括弧の有無で扱いを変えることが可能になるのである。

尚このスクリプトを用語辞書と組み合わせる場合は注意すべき点がある。用語辞書にある単語がすみつき括弧内にあるときには、検索対象から外すという工夫が必要になるのであるが、この干渉回避のやり方についての説明は別の機会に譲る。

| | Comments (0) | TrackBack (0)

2016.05.11

語釈を作る

辞書作りはそれぞれの言葉の意味を考えその語釈を作ることから始まる。編纂に携わる人は、知恵を絞ってさまざまな表現を試みている。それは新明解国語辞典の語釈などに見て取れる。

そのような姿勢は翻訳をするときにも当てはまる。辞書に載っている訳語ではぴたりとしないときには、自分で原文の言葉の意味を考え適切な表現を見つける必要がある。辞書にある表現のみが正解ではない。それにたくさんの辞書があり夫々表現が違うことも多い。自分が辞書作りの編纂者になったつもりで語釈を考える。

大切なのは自分で考えること。色々な辞書を集めてそれを探すのも一つの方法かもしれないが、それだけでは他人の考えを借用しているのと同じである。辞書にありませんでしたというのは、インターネットを検索して「ありませんでした」という学生と本質は同じこと。

特に研究や生産の最先端の言葉などは、それに携わる人々が必要に迫られて作っていることが多い。自分が異国のその研究室や生産現場で一緒に働いていると想像して訳語を考える。

重複翻訳(ある言語で書かれたものが既に別の言語に翻訳されており、それをさらに違う言語に翻訳するもの)でも辞書に載っている訳語ではうまくいかないことが多い。言語が違うと基本的な意味が同じ単語でも、その周辺に含まれるものが違ってくる。重複訳でそれが繰り返され思わぬずれになるのである。最初に書かれた言語の文書が見つかればいいが、そうでない場合も多い。やはり自分でどのような意味なのかを考えることが重要になる。

「探してありませんでした」では仕事は完了していない。なければ考えるまでである(探すは頼る)。


| | Comments (0) | TrackBack (0)

2016.05.09

切ってつなぐ

テキスト処理で行う構造解析とは、文章を意味の切れ目で区切ることである。しかし色々な事例があるので、どのような箇所を抜き出し(検索)、どのように区切るか(置換)を正確に指示しないと、思わぬところで区切られたり区切りたいものが連続したまま残るという事態が生ずる。

(1)正確な区切りをするときは、次のように予め区切ってはいけないテキスト(文字列)を個別に指定しておいて、そのあとで一括区切り処理を実行するのが普通のやり方である。このやり方には「区切る」ために「区切らない」ものも考えるという、地と図の関係というか裏表の思考法(転記か削除か)が含まれている。

   区切らないものを個別指定
   一括で区切る

(2)さらに一括区切り処理については、検索条件を工夫することで区切る対象を限定することができる。前方一致、前方不一致、後方一致、後方不一致の正規表現を使うのである。これが今までのやり方であった。

   区切らないものを個別指定
   区切る対象を限ってから一括で区切る

(3)しかし、それでもうまくいかないものが出てくる。区切って欲しくないのに区切られるという事例が出るのである。

どうしたら良いのか考えているうちにもう一段、別の次元で裏から考えるということを思いついた。つまりこれまでのやり方は「連続したものを区切る」という発想に基づいている。これによるときには、いかに切るか、いかに切らないかを考えるだけになってしまう。

しかし実は目的を達成する手段はそれだけではない。欲しいテキストとは、「あるところは連続し、あるところは区切られているテキスト」である。連続するテキストを得るためには「連続を残す」だけではなく「連続を作る」という方法もあると気が付いたのである。出発点が連続する文字列であったため、それに囚われて裏(切れている状態を出発点にする)を考えていなかったということになる。

要するに区切ったものをつなげばいいということ。区切りは改行記号を挿入して行っているが、すでに改行したものの中で改行してはいけなかった部分を検索して、そこにある改行記号を削除する工程を加えた。処理の流れは次のようになる。

   連続するものを区切る
    区切らないものを個別指定する (i)
    区切る対象を限定してから一括で区切る (ii)

   区切られているものをつなぐ
    つなぐものを個別指定する (iii)
    つなぐ対象を限定してから一括でつなぐ (iv)

最後の (iv) は (ii) の逆操作なので条件を相当厳密に指定する必要があり、まだ手をつけていない。取り敢えず (iii) の論理を加えた構造解析辞書を運用するようにしたが、前よりも区切りの精度が向上し、今のところはこれで十分である。

学んだのは、連続したものを切るばかりではない、切れているものをつなぐという発想も持ち合わせていないといけないということ。頭の柔らかさを試される経験であった。


| | Comments (0) | TrackBack (0)

2016.04.26

段取り

ドイツ系の企業グループの連結決算手続書を訳す仕事をしている。A4で200ページ。仕事に必要なものは翻訳支援ツール(今回はトラドス)とテキストエディター(いつもの秀丸)で、それにウェブ検索を組み合わせるというのは普段と変わらない。

ただ4万語の大きさになると、段取りを考えておくか否かで効率や精度に大きな差が生ずる。ここでの段取りとは、翻訳支援ツール、テキストエディター、ウェブ検索の三者の連携を良くすることであり、同時に三者それぞれの中での作業手順を十分に考えることである。

翻訳作業の中心になるのは、今回であればIFRSなどの会計基準を確認し、書かれていることを理解したうえで読みやすい訳文をテキストエディター上で作ること。それが本来の翻訳の仕事である。段取りをするのは、本業に専念できるようにするためである。

まずは翻訳に使う用語辞書の見直しがある。辞書にある用語は、訳文を作るテキストエディター(白紙訳文と名付けているもの)に自動的に入るようになっている。ただ正しい用語が出てこなければ訂正と新規入力の二度手間になるので、文書の内容に応じ会計用語、特に連結決算に関する用語を優先的に適用するよう辞書の組み直しをする。それと同時に、前方後方の一致不一致を制御する正規表現を使い、辞書の書き方を簡単なものにして処理速度を早くする。

また構造解析辞書の調整も必要になる。テキストの構造を視覚的に捉えられるよう、区切るべきところと区切ってはいけないところを指定するのであるが、それを今作業している文書に合わせて見直すのであ。ここでも前方一致、前方不一致、後方一致、後方不一致の正規表現が役に立つ。調整とは実際には、処理する対象に合わせてできるだけ正規表現を見直すことである。

それらの調整は既に組んである秀丸のマクロの修正になるが、さらに秀丸マクロに収まりきれない手順については、AHKを見直す。異なるアプリケーション間でのテキスト受け渡しにはAHKが必要になる。秀丸マクロもAHKも、一連の反復作業をキー登録してショートカットにする点では同じことである。

そこで考えておくことは、一連の作業をどこで区切りキー登録するのかということ。あまり長くしない方が良いこともある。

馬鹿の長糸という言葉もある。お作法と裁縫の授業がまだあった頃に女学校にいた母が聞いて覚えていて、話してくれた表現である。思慮の足りない娘は長すぎる糸で取り回しに苦労しているのに対し、賢い娘は使う場所にちょうどの長さの糸で手早く仕事を終えるという話。裁縫だけのことではない。仕事の内容を見極め、それにちょうど合うコンパクトな手段を選択することはいつでも大切。

また各操作をどこのキーに登録するかも考えねばならない。あちこちに分散していると手を大きく動かさねばならなくなる。さらに言えば、感覚や一連の手順に沿うような配列にすることも大切。上下左右の矢印キーは、アクティブ画面をその方向に切り替えるときに直感的に理解できるし、テンキーの123456に順番に行う操作を割り付ければわかりやすい。

段取りとは、旅客機が離陸し上昇して巡航速度に達するまでの間にたとえられるかもしれない。巡航速度に達してやっと機内サービスが始まるように、段取りを終えてから漸く本来の考える翻訳が始められる。段取りをおろそかにしてはならない。

いや段取りこそが、本来の仕事を効率よくしかも丁寧に仕上げる秘訣であって、それを含めて十全の仕事になると言った方が適切かもしれない。

そして段取りの各部分についてじっくり考えれば、道具を常に整備しておくといういつもの話になる。

| | Comments (0) | TrackBack (0)

2016.03.04

翻訳効率向上のためのワード活用法(入門編)

●はじめに
翻訳を始めて間もない頃はワードだけで仕事をしていました。その後色々なソフトを使うようになり、ワードについてもマクロなどを覚えましたが、ワードの基本機能だけでも翻訳効率と精度向上のためには色々な工夫ができます。

以下に述べるのは特別なソフトを使わず、ワードと添付の日本語入力(Microsoft IME)の環境で行える設定です。これだけでもかなりのことができ、これから翻訳を始めたい人や始めて間もない人のヒントになるかもしれませんし、帰省しているときや緊急のときなど普段の翻訳環境以外で仕事をするときにも役立つと思います。お話は英日翻訳を前提とします。

これは2015年10月に語学関連の出版をしている株式会社アルクの「翻訳通訳のトビラ」に、「翻訳効率向上のためのワード活用法(入門編)」として掲載させていただいたものです。転載をお許しいただいた同社メディア企画編集部の佐藤直樹さんに御礼申し上げます。

●画面の表示法
画面の表示法は、印刷レイアウト表示です。下書き表示、Webレイアウト表示、アウトライン表示は使いません。印刷レイアウト表示にするのは、それが紙に書くのと同じように自然に見えるからです。

●文書の背景色
最近は液晶画面のバックライトがLEDになり表示がかなり明るくなっています。このため白黒ではコントラストが強く、長時間画面に向かっていると目の負担が大きくなります。そこで作業をするときには背景色を薄いオリーブ色(RGBでR180、G185、B142)にしています。

他のソフトウェアでも色を変更できるときには、そのソフトでもこのオリーブ色とその明度違いに統一しています。対象となるのはデスクトップの背景、トラドスの各セグメント背景色、秀丸などです。さまざまなソフトの基本色調を同色に揃えると、画面が静かになり翻訳に集中できます(さらに言えば、集中するにはあまりたくさんの画面を開かず必要最小限にすることでしょう)。

●表示項目
開いたワードの画面にどれだけリボンやツールバーなどの情報を表示するかは各人の好みともいえますが、私は必要なもの以外はすべて非表示にしています。不要なものが表示されているとそれが思考の上で雑音となるからです。非表示にしておくものとしては画面上の変更履歴、罫線などのツールバー、ルーラー、本文内の編集記号、画面下の図形描画のツールバー、ステータスバーなどです。要するに実際の何も書かれていない紙に文字を書いていくのと同じような環境をワードでも作り出しているのです(実際の紙でも罫線や升目が入っていないただの白紙の方が雑念が排されます)。

もちろんそれらの情報を表示する必要が生じたり、マウスでそれをクリックする方が早いと感じるときには臨機応変に表示させます。またワードの機能に習熟していないときには、敢えて各種情報を表示する方が機能を覚えやすいかもしれません。

●用紙サイズと余白
パソコンでの翻訳作業では用紙のサイズを気にすることはありません。ただ用紙サイズが、印刷レイアウトで表示される行数や一行の文字数に影響してきますので、今は一般的となっているA4を指定します。また余白は上下左右とも25mmにしています。

●フォントと1行の文字数
フォントは横書きでの読みやすさからメイリオを使っています。またフォントのサイズは12ポイントにしています。

これは1行の文字数と関係してきます。つまり横書きで一行の文字数が多くなると視線の移動が大きく読みにくくなります。1行35字程度になるようにするとこのポイント数になるのです。

ただし1行の文字数なり行間は1ページの行数指定でも設定できるし、単独で指定することも可能です。また実際の画面での文字の大きさはズームと縮小(Ctrlキーとマウスのホイールを使います)で自由に変えられます。

●テンプレート保存
以上の準備ができたらその設定をテンプレートに保存します。これにより新しい文書は常にこの書式が適用されます。

●文字入力
文字入力にはIME以外にもATOKなど色々ありますが、私はIMEで十分と思っています。大切なのは単語登録をこまめにすることです。単語登録を工夫すれば入力のキーストロークの数が少なくなります。たとえば「登録」という漢字は「とろ」にしておくとか、「しく」で「してください。」とするなどです。文末などは句点まで登録するとかなりの省力になります。「をく」で「をクリックします。」など、色々用意しておくと便利です。

単語登録での読みは2文字か3文字にします。2文字なら入力は速いのですが、同じ読みのものが多くなると選択に時間がかかります。3文字ならストローク数が1文字余計になるので入力時間が増えますか、その読みで出てくる選択肢が少なくなるので選ぶのに時間がかからなくなります。まずは2文字で登録して、同じ読みの登録が増えてきたら3文字登録に切り替えるというような微調整をしながら両者を併用します。

うまく漢字変換ができるかどうかは文章を書くときの思考の流れに一番影響します。様々な単語を登録して育てた自分の辞書はバックアップをとり、その辞書はパソコンを変えても引き継いでいきます。

●親指シフト
今回の「ワードと添付の日本語入力の環境で行える設定」という枠から外れるのですが、日本語入力には多くの方がお使いのローマ字入力ではなく、親指シフトによるかな入力を使っています。これは各人の好みですが、親指シフトは思考を中断せず入力速度も速いように感じます。簡単なソフトを導入すればすみますのでお試しください。

●2つの枠
原文と訳文をどのように並べるかは翻訳効率に大きく影響します。大切なのは両者をできるだけ近くに並べることで、それにより比較対象が楽になります。具体的にはワード文書を2つ用意し(白紙原文、白紙訳文という名前のファイルを用意しておきます)、それを併置して開きます。その上で横長のウィンドウを上下に2つ並べるか、縦長のものを左右に並べるかします。

Vertical_2

または

Horizontal

私は縦長のものを左右に並べる方が使いやすいように感じています。それは英語と日本語の文章構造の違いに由来します。つまり英語の動詞は比較的先に出てきますが、それに対応する日本語の述語は文の末尾に来ます。そこで横長にすると視線が原文の左端と訳文の右端とで行き来することになります。それに対して縦長では上下の視線移動は多少あるものの左右はそれほど動かさずにすむからです。

●段組み
視線移動を少なくするという点では、段組みを活用することもできます。これは縦長のウィンドウを左右に並べるやり方の応用で、用意する文書は1つですみますが、そのままでは長い文書の翻訳には向いていません。

Column_3

段組みには段区切りの記号を目印にして、カーソル位置を原文側と訳文側で切り替えることができるというメリットもあります。ただこれをするためには多少VBAの知識が必要になりますので今回は割愛します。

以上、翻訳効率向上のためにワードをどのように活用できるか、その入門的なお話をしました。ある程度習熟してきたらマクロにも挑戦したくなるでしょう。あるいはテキストエディターを使う方がいいと思うかもしれませんし、複数のソフトの間でテキストの受け渡しをしたくなるかもしれません。それらについてはこの「翻訳のサロン」の該当記事をご覧ください。


| | Comments (0) | TrackBack (0)

2016.02.12

単語の認識

翻訳するときには原文欄と訳文欄を並べて、原文を見ながら訳文を書くようにしている。恐らくどの人も同じようなことをしていると思う。ただパソコンで訳文を書くなら、パソコンで可能なことはなるべくそちらにやらせたい。

そこで原文の中の言葉を自家製辞書と比較して、その辞書の訳語を訳文作成欄に自動的に出すという工夫が生まれる。出てくる場所も原文欄で当該単語のある位置に対応するように作る。

このようにして真っ白い訳文欄のあちこちに訳語が出てくる(原文は一切出ない)。それが訳文作成時の発想の出発点になる。ちょうど硫酸銅の青い溶液の中に種となる結晶のかけらを吊るして大きな結晶を得るようなもので、これを「結晶方式」と名付けている。原文の中に訳語が混じる混在文を使う方式とは異なる。

しかしあるとき、この発想の核となる言葉が機械に掛けても出てこなかった。辞書に入れてある言葉なのにヒットしない。おかしいと思って調べると、原文のその単語の後にハイフン(-)が付いていた。なるほど原因はそれか。

実はハイフンに限らず単語の前後には色々なものが付いたり活用したりしている。その単語だけで登録していては、そのものずばり以外の変化形はヒットしない。そこで、ある言葉を自家製辞書に登録するときには、前後に付くものやその言葉自体の変化(活用)を正規表現にしてそれまで登録してしまうのである。それにより辞書検索時のヒット率が格段に高くなる。

正規表現を使った検索条件は様々な場合を想定して作ってあるが、ハイフンが付く場合を条件に入れていなかったので出てこなかったのである。それを修正しつつ、単語の認識率向上のためもう一度検索条件のうちの単語の前後に付くものや変化のパターンを見直すことにした。

ではどのようなパターンがあるのか。以前にもこの翻訳のサロンで概説しているが、ここでは単語の後のパターンについて少し詳しく説明する。単語の前のパターンについては別に説明する。

(i) まず複数形の処理を考えねばならない。英文法では名詞が複数形になるとsを付ける、esを付ける、yをiに変えesを付ける、f, feをvに変えてesを付ける、というような規則がある。例えばsの付いた名詞を認識させるにはどうするのか(以下では説明単純化のため単にsが付く場合のみ考える)。

(ii) 次に単語の後が区切りや文末になっていれば、カンマやピリオドが付いている。コロンやセミコロンが付くこともある。今回のように「-」が付いていることもある(なおハイフンには同じように見えても機械では別物と認識されるものが多数あるので、ここでは省略しているが注意しなければならない)。

以上の考え方を正規表現でどのように表現するかを秀丸で説明する。

まず (i) の複数形については、辞書にある単語の後にsが付くか付かないかである。その後の (ii) カンマ、ピリオド、コロン、セミコロン、ダッシュについては、付くか付かないかである。注意すべきは (i) と (ii) は、その順番で生起し、かつそれぞれが独立した条件であって、どちらかに内包されるものではない点である。

そこで、辞書にABCという単語があったときにはその後に
s?(\\.|,|:|;|-)を付加して

  ABCs?(\\.|,|:|;|-)

と書くことになる。s?は、sがあってもなくとも、の意である。(\\.|,|:|;|-)は、ピリオド、カンマ、コロン、セミコロン、ハイフンのいずれかという意味。ピリオドは正規表現で特殊な意味を持つのでそれ自身を表すときにはエスケープ記号\\を付ける。これらの要素が括弧()に入っているのは、置換のときにそのままで訳文に渡すのに必要になるためである。

(iii) ところで単語の後には普通は空白がある。空白があるから長い単語の一部を別の単語と誤って判断することがなくなる。例えばmilestoneをmileとstoneと判断したり、milesとtoneと判断するようなことが防止されるのである。

空白は、単語本体(sの有無はあるにせよ)の後に続くので、(ii) のピリオド、カンマ、コロン、セミコロン、ダッシュが単語本体の後に続くのと同じように考えられる。ということは (ii) に空白も含めればよいということになる。そこで

  ABCs?(_|\\.|,|:|;|-)   「_」は空白を示す

と書くのが、上に述べた単語の後の処理のまとめである。これで単語の複数形やその後に付くものについて次の12の変化を検索でヒットさせることが可能になる。

ABC_    「_」は空白を示す
ABC.
ABC,
ABC:
ABC;
ABC-

ABCs_    「_」は空白を示す
ABCs.
ABCs,
ABCs:
ABCs;
ABCs-

以上は説明単純化のため単にsが付く場合のみとしたが、実際の自家製辞書には名詞の複数形に、esを付ける、yをiに変えesを付ける、f, feをvに変えてesを付けるという場合も含めなければならない。また動詞の活用(三単現のsなど)、形容詞と副詞(fullとfullyなど)についても考えねばならない。さらに単語の前についても検討が必要である(前方一致の機能を使う)。これらについては別に書いてあるものや、これから書くものを参照されたい。

このような作業をする際に大切なのは、一つ一つの事例を丁寧に見ること、そこにある規則性を一般化すること、そしてそれを言語で表現してみることである。言語化が正規表現の一歩手前なのである。またヒット率を上げるためには単語帳を常に改定することも大切になる。単語自体の追加や見直しだけではない。ここに述べたような単語の前後の条件の追加や見直しも倦まず続けなければならない。

とはいえ完璧を求める必要はない。無いよりまし、少しでも手助けになればそれでよし、実用上差し支えなれば大出来くらいに考えることも大事である。

| | Comments (0) | TrackBack (0)

2016.01.03

括弧書き

外国人が日本の風習を研究して論文を英語で書いた。それを日本語に訳すという仕事がきた。そこにときどき括弧書きで日本人以外の読者の助けになる情報が書かれている。さてこれをどうするか。

括弧書きは読者のよく知らない事項について説明をして理解の助けにするものである。読者に自明なことは括弧書きにする必要はない。これを翻訳の世界に当てはめるとどうなるかを考えてみる。

(1)原文の世界でも訳文の世界でも余り知られていない事柄であれば、括弧書きはそのまま訳す。
(2)原文の世界では自明であるが訳文の世界では知られていない事柄であれば、原文にはなくとも括弧書きを添える方が読みやすくなる場合がある。括弧の替わりに訳注にするという手もある。
(3)原文の世界では知られていないことなので括弧書きがあるが、訳文の世界では自明の事柄であれば、原文にある括弧書きを訳す必要がないという判断をすることもある。

なぜそうするのかという原理を考え、そのうえで場合分けをすると答が見えてくる。冒頭の事例はこの3番目に該当する。日本人に日本の風習を改めて説明する必要などないからである。

もちろんこれがすべてではない。仮に英語の読めない日本人の学者がこの論文を査読するとなれば、外国人研究者の実力を判定するために括弧書きまで忠実に訳す必要があるかもしれない。しかしこの論文を一般の読者に読んでもらうということであれば、括弧書きを訳す必要はない。要は対象読者を考えてバランスをとるということになる。

| | Comments (0) | TrackBack (0)

2015.09.01

世界に影響される

今はある言語を使う人が世界中にいる。その言語を母語にしている人が各地に散ってそこで話すというだけではない。その言葉を母語としない人が移住してきてその言語を話すことがある。さらに母語の圏外にいながらその言語に影響を与えることすらある。そんな経験をした。

話はある文書に出てくる機械部品の訳語についてである。多くの部品の名称と規格はJISに定められている。対応する英語を日本語にするときにはJISにある表記を使うのが一般的である。

ところがある部品でJISの定めたものではない訳語が使われていた。検索をしてみるとこの訳語は中国の企業向け電子商取引サイト、アリババのページに出ている。しかもそれに類似のサイトが多数出てくる。それ以外では検索されない。

この文書を翻訳した人は、訳語を決定するにあたりアリババで使われている事例を一般的と思ったらしい。もう一歩踏み込んでJISを調べなかった。

アリババで拡散された誤訳がネットを通じて世界に拡散する。そして日本語を母語とする翻訳者ですらそれに影響されるという話である。

もっともアリババが最初に各国語に翻訳したときには、それぞれの言語を母語にする者に翻訳をさせた可能性が高い。とすればこの事例では元のアリババのサイトの翻訳に関与した日本人の誤りが、他の日本人による今回の翻訳の誤りに手を貸したということかもしれない。

純粋に一つの言語に限っても、誤用がいつの間にか主流派になるという話はよくある。性質としては昔からある話であるが、誤用や誤訳も世界規模になってくる。


| | Comments (0) | TrackBack (0)

2015.05.16

翻訳テキスト処理の効率化セミナー

5月17日(日)に東京ほんま会で翻訳テキスト処理の効率化についてお話する機会をいただきました。AHK、ワードマクロ、秀丸マクロなどを使い、トラドスなどの翻訳メモリーソフトやウェブ、テキストエディター等を横断してテキスト処理を効率化する工夫についてお話しました。構造解析、用語集の作り方、AHK等のマクロによるアプリケーション相互の連携法についての説明や演習もしました。

以下にそのときの資料を掲げます。どなたでもご覧いただけます。お役に立てれば幸いです。

「Presentation.doc」をダウンロード

「structural_analysis.MAC」をダウンロード

「line_swap.MAC」をダウンロード

「autohotkey_for_tkyo_homma_kai.ahk」をダウンロード

「example_for_tokyo_homma_kai.txt」をダウンロード

| | Comments (0) | TrackBack (0)

2015.05.12

テキストのアウトライン表示

翻訳作業にはテキストファイルで構造解析辞書と用語集を作り使っている。テキストファイルにするのはワードファイルに比べて処理速度が速いからである。

ただこの構造解析辞書と用語集のファイルが、新たなロジックを取り入れたり、単語を登録することで次第に大きくなってきた。それだけでなく、案件により微妙に処理内容が変わるため、両方とも頻繁に手を入れる必要もあるが、そのような作業で目的の行に到達するのに時間がかかるようになってきた。処理の干渉を点検するため、開いたファイルのあちこちを移動することもあるが、それもやや大変になってきた。

そこでアウトライン表示を活用することにした。テキストファイルを開くときには秀丸を使っているが、この2つのファイルを開くときにはアウトライン表示にするのである。それにより目的の場所に素早く行き着くことが出来る。

しかしアウトライン表示を活用するためには、処理の順番を考えながら類似する処理を一まとめにする必要がある。その作業は面倒なように思われるが、実は類似のものをまとめて眺めていると、ファイルの構成を変えたり正規表現処理を統一するなどの手直しのアイディアが浮かんでくる。アウトライン表示には、目的の場所に素早く行くというだけではない別の効用がある。

急がば回れ、順番にやればいいことがある。

| | Comments (0) | TrackBack (0)

2015.05.08

訳文を磨く

ある方から翻訳したものの一部をいただき、その中の次の文章についてやり取りをした。

------------------------------
An introspective, defensive, protective mood gradually enveloped Notre Dame as the clergy defended its exalted position against an encroching nobility and commons.
------------------------------
貴族や市民階級に地位を脅かされまいとして、高位聖職者が汲々とすればするほど、神経過敏な内向きの心理がノートルダム全体に広がった。


最初に「汲々とする」という表現におやと思ったが、考えているうちにその表現(文の綾)の話もあるが、文章の構造をどう作るかが大切ではないかと感ずるようになった。

そこで論理的な筋道を明らかにして
------------------------------
台頭する貴族や市民階級から高位聖職者が特権的地位を守ろうとしたため、ノートルダムは内向きの守りの姿勢をとるようになった。
------------------------------
という訳文を考えて提示した。


それに対してご返事があった。「汲々」という言葉を使ったのは、挙げられた一文がそれまでに述べたことを濃縮したような文章なので、読み手に少し立ち止まって欲しいと思われたからであるという。

その上で原文の接続詞の as について書いてくださった。as は因果関係を強く示しているのではなく、gradually と呼応する形で「~にしたがって、~につれて」という意味に訳す方がよいように思うと、ランダムハウスを引用しつつご意見を述べられた。

------------------------------
as(部分引用)
【3】…につれて,に従って:As one grows older, one comes to appreciate the little things in life. 人は年を取るにつれて人生の中でのささいな物の価値が分かってくるものだ.茵文語で so と相関的に用いることがある:As you go farther north, so the winters become longer and more severe. 北へ行けば行くほど冬は長く厳しくなる.
【6】…の時,の途端;…しながら(when, while よりも同時性が強い)【語法】:as you look away よそ見をしている間に.
------------------------------

原文の as に因果関係の意味合いがないわけではないが、書き手はいかにも歴史家らしく、客観的な事実だけを述べて、因果関係を示そうとしていない、「話の論理的な筋道を明晰にする」局面ではないと思うというのである。

この方もどちらかというと「道筋」を見つけたくなるタイプであるけれど、いろいろな原文をつきあうと、相手によっては「ここはぐっと我慢、そのほうがいい」と思うときがあるとも書いてくださった。


なるほど、as をどう考えるか。この言葉には「であるから(因果関係)」という意味もあるし、「につれて(同時進行)」という意味もあることから、この文章を同時進行を意識して訳してみた。

この文章に「につれて」という同時進行があるとすると、何と何が同時進行なのかを考える必要がある。進行するからにはそれは行為、つまり動詞またはその名詞化されたものである。ここでは3つの行為が挙げられている。

・ノートルダムの内向化
・高位聖職者の特権の維持
・貴族や市民階級の台頭

そのどれとどれが同時進行なのか。as の位置からすると同時進行は内向化と特権維持である。そのような解釈で訳文を作ると
------------------------------
台頭する貴族や市民階級から高位聖職者が特権的地位を守ろうとし、それとともにノートルダムは内向きの守りの姿勢をとるようになった。
------------------------------
という訳文もありかもしれない。勉強になった。


会話や対話をしていて楽しく意味深いものになる機会は以外に少ない。翻訳をする人たちの間での自主的な訳文検討もやってみると結構難しい(講師が添削するというのならまた別であるが)。その方もいろいろ試し、誰とでもうまく訳文検討ができるわけではないと思うようになったという。

しかし「それだけ翻訳という仕事は難しい、だからこそ面白い仕事でもある。それを広くわかってもらいたい、翻訳という仕事の価値を高めたいというのが密かな野望」であると書かれていた。そうでなくては。

| | Comments (0) | TrackBack (0)

2015.02.19

1対0の関係

言語が異なれば表現方法も変わる。単語レベルで考えても、同じような単語でもその意味する範囲が必ずしも同じではない。ベン図にすれば重ならないところがあり、異なる言語の単語同士が1対1に対応していないのである。

これを原文と訳文の単語の数に着目して表現すると、「原語の1語を数語に訳すことも、原語の数語を1語にすることもある」ということになる。

言い換えれば、原文にない単語でも訳文で付加する場合があるし、原文にある単語でも訳文で省略する場合があるという話である。それを数式にすれば

最初の例は
(1対1)× m +(1対0)× n と書くことができ、
次の例は
(1対1)× m +(0対1)× n と書ける。

この考え方は翻訳のチェックを自動化するときに重要になる。1対1だけではなく1対0または0対1を忘れないようにするということである。

つまり原文と訳文を比較し、訳文に対応する単語がなくとも、単純に訳抜けとは決められないのである。それが訳抜けなのか、考え抜かれて省略されたのかをよく判断する必要がある。逆に訳文に余計な単語が付加されているときにも、その単語はお節介ではなく必然で加えられたかもしれない。機械的にチェックする場合には要注意である。

対応するものが0であるということ、人間社会で何かに使えないか考えてみる。

| | Comments (0) | TrackBack (0)

2015.02.15

テキストの入れ替え

文章を書いていてテキストの前後を入れ替えたくなることがある。特に翻訳をしていると原文と訳文とでは語順が異なるので入れ替えがしばしば出てくる。

前には縦積みになっている2行または3行の入れ替えを紹介したが(こちら)、1つの行の中で前後を入れ替えたいこともある。以下には、カーソル位置を基準にしてその前後でテキストを入れ替えるコマンドを示す。例は秀丸のものであるが、考え方はワードでも同じ。

文末に句読点がある場合とない場合の2つの例を掲げる。

(1)文末に句読点などがあるとき
setcompatiblemode 0x0F;
disabledraw;
//論理行の行末まで選択
//範囲選択開始
beginsel;
//論理行末に移動
golineend2;
//一つ左に移動
left 1;
//切取り
cut;
//論理行の行頭に移動
golinetop2;
//貼付
paste;
endmacro;

(2)文末に句読点などがないとき
setcompatiblemode 0x0F;
disabledraw;
//論理行の行末まで選択
//範囲選択開始
beginsel;
//論理行末に移動
golineend2;
//切取り
cut;
//論理行の行頭に移動
golinetop2;
//貼付
paste;
endmacro;

要はテキストがどのように表示されているかを観察すること。今回はテキストを眺めていて、縦積みだけではなく1行の中での入れ替えもあると気付いたのである。

そのあとはいつもの如く、必要になる動きを細分化して記述する。記述ができればそれをプログラムにするのは簡単になる。

何かを達成したいというとき、大きく見ると同じことでも実際の状況は一つ一つが異なっている。とすればその状況に合わせた手段(道具)も毎回違う。そこで道具は個別にいくつも使い分ける必要が出てくる。またさまざまな道具を組み合わせて使う必要も出てくる。

(ただ行単位の入れ替え、一文の中での入れ替え、文末に句読点のあるなしでの違いなど、個別の状況に合わせた道具が増えてくると、それを必要なときにすぐに使えるように整理することが大切になる。思考や自分の作業手順に合わせながら、指の動きを最小にするようにショートカットキーを割り当てねばならない。)

| | Comments (0) | TrackBack (0)

2015.01.23

カンマの後の改行 前方不一致

英文テキストにカンマが入っている。そのカンマの後で改行したい。そのときには検索と置換を使うことになる。カンマを検索して、カンマの後に改行マークを入れたもので置換をすればいい。但しいくつか考慮すべき点がある。

まず、数字の間に入っているカンマの後では区切らないようにしたい。また、改行位置はカンマの直後ではなくカンマの後の空白の後にしたい。

以上の条件で秀丸を使った改行の方法を考えてみると色々な解法がある。

(1)カンマの前に注目すると、数字でない文字とカンマの組合せと考えられる。数字以外は[^0-9]{1,}という正規表現となる。但し秀丸はそのままでは最長一致で検索するので、?を付加して最短一致の検索に変える必要がある。次のコマンドで数字でない文字とカンマの組合せを検索し、それに改行マークを付加したもので置換が行われる。
replaceallfast "([^0-9]{1,}?), " , "\\1, \\n" , regular, nocasesense, inselect, nohilight;

(2)秀丸には前方一致、前方不一致、後方一致、後方不一致という便利な機能がある。そのうちの前方不一致を使えば、前が数字以外のカンマだけを検索するので最短一致を考える必要がなくなる。知っておいて損はない。
replaceallfast "(?<![0-9]), " , "\\1, \\n" , regular, nocasesense, inselect, nohilight;

(3)発想を変えカンマの後に注目することもできる。実はカンマと空白の組合せを探せば普通は十分である。
replaceallfast ", " , ", \\n" , regular, nocasesense, inselect, nohilight;

しかしこれで動かないようなテキストがあるので、上の2つの解法も紹介したのである。同じことを実現するにしても、色々な方法がある。

なお、うまく動かないとき暫くそのままにしておくと、あるときふと別の解法が思い浮かぶことがある。科学史に色々な例が出てくる発見と同じ。

| | Comments (0) | TrackBack (0)

«船に刻む