まず準備として, 先ほど解説したログファイルを, 自分の作業場所に保存します. ただし, この操作は教育用計算機システム 内からでないと行なえません.
この「ログファイルのありか」と書いてあるところをマウスで左クリックしてください. そうすると,次のような画面がウェブブラウザの新しいウィンドウで開かれます.
さらに必要なログの年,月を選択し,クリックしていくと次のような画面になります.
ログは時間毎に細かいファイルに分けられています. いつの日時のログかはファイル名から知ることができます. 例えば, access_log.200403242330 というファイルは2004年3月24日23時30分以降のログが記されています. ここではある一日分を選ぶとして, 選んだ日のログ全てを自分のディレクトリに保存してください. 保存の方法は, 保存したいファイルにマウスポインタをあわせて左クリックです.
Safariでこの作業を行うとログファイルはデスクトップに保存されます.適宜ホームディレクトリの下にこの章の作業用のディレクトリを作り,そこに格納するなどして対応して下さい.
一日分全部は沢山ありすぎて面倒だと言う人は,数時間分で妥協しても構いません. ただしその場合, 時間別グラフを描いた場合などに影響がでますので, 特定の時間のみを使っているということを覚えておいてください.
保存が成功したかどうか以下のように確認してみましょう. ターミナルウィンドウで,ファイルを保存したディレクトリをカレントディレクトリとして (13.4.3 カレントディレクトリの変更), wc access_log.* というコマンドを入力し,以下のような出力が得られれば成功です.
wc access_log.* 1313 25284 273973 access_log.200403242330 1647 31073 332376 access_log.200403242340 1751 33129 360642 access_log.200403242350 4711 89486 966991 total
と表示された場合は成功です. 各行に出てくる数は, 左から順にファイルの行数, 単語数, バイト数です. 当然ログファイルの大きさによって (従って選んだ日によって) 変わります.
なお,ここで使った * という記号はワイルドカードです (13.4.11 複数ファイルの処理).
wc: No match.
と表示された場合は, このページの作業のどこかで失敗していますのでもう一度最初から慎重にやり直してみてください. それでも分からない場合は TA の人などに質問しましょう.
このままでは沢山のファイルがあって不便なので, データを一つのファイルにまとめます. それにはターミナルウィンドウで cat というコマンドを使います. 先ほど選んだ日が3月24日だったとしたら以下のように行います.
cat access_log.20040324* > 24Mar
とします. 以後この 24Mar というファイルを使います.
また, もとのファイルは不要なので,消しておきます.
rm access_log.20040324*
この練習が最後まで終わったら, 一つにまとめたファイル(例では24Mar)も消すようにしましょう. 非常に大きいからです.
最後に,誤って消してしまわないように書き込み許可を消しておきます (13.4.13 パーミッション).
chmod a-w 24Mar
27.1 概要 | 27.2 準備 | 27.3 grepによるテキストデータの検索 | ||
2009年度版に向けて現在作業中です.
このページに関してお気づきの点がありましたら
コメント投稿システムまでお願いします.
|
Mon, 31 Mar 2008 13:11:52 JST (487d) |