« 正規表現を使った翻訳のマクロ | Main | 選択して文末移動 »

2014.05.29

転記か削除か

地と図という考え方がある。見方によってテーブルになったり向き合う人物の横顔になったりするというあれである。この考え方は仕事でも使える。例えば現代のコンピューターを使った仕事では電子テキストの一部を転記するという操作がよくある。手作業で転記していては数字や略語の転記ミスが発生する。転記ミスを防ぐにはどうすればいいか。

そこで地と図の逆転という考え方が役に立つ。どういうことかと言えば、転記はテキストの中から「必要なものを移す」という考え方によっているが、発想を変えてテキストの中から「不要なものを削除する」と考えるのである。

この考え方なら、まずテキストを全部コピーしてその中から不要なものを削除する。残したいのが数字や略語であれば、それ以外を削除して残った数字や略語はそもそも元のテキストにあったもので、転記ミスは発生のしようがない。

さらにその「不要なものを削除する」ときにも地と図を逆転させた考え方が使える。つまり「不要なものを削除する」とは逆にいえば「必要なものを残す」とも考えられるのである。結果は同じであるが実は正規表現の書き方が違ってくる。○○を検索するという正規表現と、○○以外を検索するという正規表現の両方が可能になる。

留意すべきは、一つの正規表現ですべて処理しようとせず、単純な正規表現の処理をいくつか組み合わせて順番に処理することである。

例えば数字や略語を検索するという場合、3桁の数字なら[0-9]{3}、英字大文字の3字略語なら[A-Z]{3}という正規表現が基本になる。ただし実際には数字ではカンマや小数点の処理や、桁数、或いは数詞や単位との複合処理等を考える必要がある。また英字大文字についても固有名詞と複合しているときや数字と一緒になったときなどの場合分けをしなければならない。場合によっては前方一致や後方一致という条件も必要になる。

しかし以上のことを実現する正規表現を一度作っておけば、コピーと複写を繰り返す手間も省ける。

地と図、表と裏、逆転の発想、足し算か引き算か、色々な言い方はあるが、仕事をするときには役に立つことが多い。

(なお実際にプログラム化するには、引き算をする前に一部の単語を用語集などで置換してしまうと良い。年月日変換も正規表現にして用語集に組み込んでおく。)

|

« 正規表現を使った翻訳のマクロ | Main | 選択して文末移動 »

Comments

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/20048/59723390

Listed below are links to weblogs that reference 転記か削除か:

« 正規表現を使った翻訳のマクロ | Main | 選択して文末移動 »