17.3 テキストデータの処理の基本

小説や報告書や統計表のような「ふつうの文書」が手元にあるものとしましょう. これらの処理としては, まるごと印刷したり保存したりすることのほかに, 文字列を基本とした次のような操作が考えられます.

これらはそれぞれ簡単な処理ですが,目的によってはとても役に立ちます. ある小説の中でのある単語の使用箇所を全部調べたり, 主人公の名前を一斉に置き換えたりする処理などがその例です.

上に挙げた処理の内容をさらに細かく見ると

という操作の組合せであることがわかります. このような処理をテキスト処理 (text processing) あるいは文字列処理 (string processing) と呼びます.

17.3.1 文字列の検索

文字列を検索する方法について学びます. ここでは, grep というコマンドを用いて,検索を行います.

17.3.2 文字列の置換

文字列を置換する方法について学びます. ここでは, sed というコマンドを用いて,置換を行います.