水無月ばけらのえび日記

bakera.jp > 水無月ばけらのえび日記 > ログの URL 末尾にスラッシュを捏造する IIS

ログの URL 末尾にスラッシュを捏造する IIS

2003年4月17日(木曜日)

ログの URL 末尾にスラッシュを捏造する IIS

更新: 2003年4月25日

だいぶ前から、こんな感じの不思議なログがあって気にはなっていたのですが。

GET /foo/ - 302
GET /foo/ - 403

※ここで foo は仮名ですが、そのディレクトリは存在しています。

いろいろ調べてみると、どうも GET /foo という末尾にスラッシュのないリクエストに対して /foo/ へのリダイレクトを発行したときに、GET /foo/ - 302 というログが残る模様。リクエストされたのは /foo なのに、ログには /foo/ と残ります。IIS が勝手に末尾にスラッシュをつけているようです。PATH_INFO が無くなってしまう点と言い、なんかどんどん IIS のログが信用できなくなってくるわけですが……。IIS6 では良くなっているのでしょうか。

ちなみにこのログが残るパターン、最近割と良く出現しているのですが、User-Agent は「dloader(NaverRobot)/1.0」で、見るからにロボットです。そもそも /foo をリクエストしている時点でおかしいと思うのですが、/foo/ へのリダイレクトを何度喰らっても一向に学習しないあたり、何とかならないのでしょうか。

※追記: ごめんなさい、誤解を招く記述でしたが、学習しないというのは 302 を理解しないという意味ではなくて、何度 302→403 を喰らっても懲りずに /foo をリクエストするのはちょっとなぁ、という話でした。

※さらに追記: しかし考えてみると、302 のレスポンスはむしろ Permanently な移転ではない、という意思表示な訳で、また別の機会にリクエストしたら違うレスポンスになる可能性があるわけです。なので、302 → 403 を喰らっても懲りないのは、むしろ正しい挙動だと思います。……って、実はえむけいさんに思いっきり突っ込まれたのですが。

ついでに調べてみると、ここ一週間ほどで 302 が発行されたのは、このロボットに対してだけでした。つまり /foo に外部からリンクされていたりする形跡も無いわけです。このロボットが勝手に上のディレクトリを参照しようとして、その時に末尾の / を落としているものと思われます。

※追記: これまたごめんなさい、実は外部から /foo/ に対するリンクがありました。でも /foo に対するリンクではなく /foo/ に対するリンクなので、それで /foo をリクエストするのも変なのですが。

……せっかくなのでこのロボットについてちょっと調べてみましたが、「robotはぢきについて (c-moon.jp)」というサイトの「その他・危険ロボット」の中にそれらしきものが……。あんまりよろしくないロボットらしいですね。

※ところで、User-Agent と言えば Some Gripes on User-Agent (http://www.dais.is.tohoku.ac.jp/logs/agentgripes.html) だったのですが、このサイトは消滅してしまったのでしょうか? 便利だったのに……。

関連する話題: IIS / httpd / altba.com / サーバ / UA / dloader

最近の日記

関わった本など