« 引用符の個別指定 | Main | 数字の日本語表記 »

2014.01.04

文字固定 書式利用

ワードの検索では検索対象について書式条件を付けられる。検索対象を書式のある部分だけにする、書式のない部分だけにする、あるいは書式の有無を問わず全部を検索するというような指定ができるのである。置換後のテキストに特定の書式を付けることも可能。

これを活用するとテキスト処理の可能性が格段に広がる。検索置換でハイライト書式を使いテキストを固定するのがその一例である。

検索置換処理の対象をハイライト書式のついていない部分に限定すれば、ハイライト部分は処理の影響を受けない。そこで検索置換をしたくない部分を予めハイライトにするのである。つまりテキストの一部を不動文字にして固定したということになる。

aaaという単語がaaa単独で使われるときとaaa xxxというように他の単語と併用して使われるときとで意味が違うという事例を考える。aaa単独なら普通名詞であるが、aaa xxxとなったときには特定の学術用語や商品名で原語のままにしておかねばならないということはよくある。

このときにはaaaを一括して処理できない。そこでまずaaa xxxを検索してハイライト書式をつけて固定しておく。そのあとでハイライトされていないaaaだけを一括処理する。

このような手法は原語テキストを一括処理するときに一部のテキストを原語のまま残すためのやり方である。「aaa xxx」を「甲の一番」というように別のテキストに置換(翻訳)してしまえばハイライトにする必要はなくなる。ハイライトも別テキストへの置換もその後の一括処理の対象にならないようにする工夫である。

ではこのテキスト固定の手法を翻訳でどのように使うのか。文書の構造解析や用語の検索置換に用いるのである。実際には構造解析辞書や一括置換用辞書に組み込むことになる。

組み込むときに注意すべきは長いテキスト(上の例ではaaa xxxの方)を先に処理すること。ある単語を他の単語と組み合せると意味が個別化してくる。それを処理してから一般的処理をする。例外処理を先にしてから一般的処理をするのがテキスト処理の要諦である。

|

« 引用符の個別指定 | Main | 数字の日本語表記 »

Comments

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/20048/58880704

Listed below are links to weblogs that reference 文字固定 書式利用:

« 引用符の個別指定 | Main | 数字の日本語表記 »