この章では大量のテキストデータから自分のほしい情報を抽出する方法を学びます. 例としてとりあげる, Web サーバ のログファイルには, 1. いつ, 2. 誰が,3. どのウェブページをみたかが記録されています.
例えば
157.82.40.158 - - [12/Apr/2004:21:00:38 +0900] "GET /~cc76805/ HTTP/1.0" 404 281
という行は,
見ようとした人がいる,ということを示しています.
これらは1日分でも500行以上という膨大な量になります. この大量のデータの中から,
という作業を例にデータ処理について実習します.
27. データ処理 | 27.1 概要 | 27.2 準備 | ||
2009年度版に向けて現在作業中です.
このページに関してお気づきの点がありましたら
コメント投稿システムまでお願いします.
|
Mon, 21 Feb 2005 00:25:48 JST (1622d) |