weblog

タケウチくんから、サーバのアクセスログが1.6GBになってるから
削除していい?と聞かれた。
アクセスログは当然テキストで書かれたデータで、
テキストデータ1.6GB、賢明な諸君ならいったいどんだけの
ログがあるのか想像に難しくないだろう、とか言って
全然想像範囲外なので、計算してみると、

1.6GB=1600MB=1600000KB=1600000000B
で、日本語が2バイト文字なので
日本語に換算すると8億文字。
で、1秒に8文字読んだとすると
8億/8文字/60/60/24/365=3.17年かかる。

くらい膨大。

これをリセットしてもらって、2日と半日でログが既に、
265812行になっている。
延26万回、j-love.info下のファイルにアクセスがある。2日間半で。

26万行のログを見ていると、ああ、
これだけ世界中(主に日本だけど)からファイルを
繰り返し読み込まれているわけだから、
htmlファイル一つにしてもファイルサイズを小さくする試みは
全然馬鹿にできない。と思う。

まずはエラーログ5235行を見て簡単な対策を講じる。
robotの巡回で毎回チェックされるrobot.txtをupしてみたり。
無駄にクロールされるurlを省いてみたり。
google sitemapを見てみたり。
まあでも一番多いのはアクセス解析cgiへのミスリンクだな。
これ何とかしなくては。
あとはスパムもこのログ見て回避できればいいんだけど多すぎるよなあ・・