category label

いんくとみ

29 January 2006 (Sunday) 12:04 AM

いんくとみ

ほんとになんとなく,サーバスペースで提供してくれているアクセスの生ログを見ていたら,
/SlurpConfirm404/knuddel/lemm1st/lazyjane.htm
/SlurpConfirm404/mbell/post_17.htm
/SlurpConfirm404/lumiere.htm
/SlurpConfirm404/poetry_index.htm
/SlurpConfirm404/dietlinks.htm
/SlurpConfirm404.htm
/SlurpConfirm404/Chocolate/_184564510/jump.htm
/SlurpConfirm404/wopmisasp/photothumb/TrumpetSeance.htm
/SlurpConfirm404/utter/_1374600176.htm
/SlurpConfirm404/auth/rule.htm

などという気持ち悪いURLを指定している謎なアクセスが・・・

LazyなJaneなんて人も知らないしdietもしてないしpoetryな要素なんて無いし,どっかのサイトと混線しているのか,いかがわしいアタックなのか,ていうかそんなことあるのか?でもところどころにlemm1stとかphotothumbとかrule.htmとか見覚えのある特徴的な文字列もあったりして,あながち間違いではないのかも,と思ってUAをよくよく見てみると
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
となっている,ドメインもinktomisearchだし,なんだ,単なるヤフーのロボットじゃん.しかしながら意味不明ですよ.
Yahooともあろうものが,NaverBot(今はrobots.txtに "User-Agent: NaverBot* \n Disallow: /" を指定しているのでもう来なくなったけど)並に酷いクロールをしていってるのかと思ってたら違う模様.

UAにあるURLにアクセスしてみると クローラーの説明ページである,ただし英語.
その中に,"Why is your crawler is asking for strange URLs that have never existed on my site?" つまり「なんで人のサイトで変なURLをリクエストしやがるのか?」という問いと答え,つまりQ&Aがあった.
答えのページには,
Your crawler is asking for strange URLs that have never existed on my site, like /piopio/darkness-halo-bottom-camera.htm. Are you looking on the wrong host?
Some web servers send a site navigation page or other response page with a "HTTP 200 OK" response instead of a "HTTP 404 Not Found" result for page-not-found conditions. To check on web server handling of page-not-found conditions, Slurp will occasionally send deliberately odd URLs built from random words to sites from which no 404 results have been seen. These URLs are built intentionally to not match any actual content at the site. We save information on the web server response to requests for non-existent pages so we can correctly recognize and remove obsolete URLs in our search database.
A Slurp check for 404 results from a web server consists of requests for up to 10 such URLs. The check for 404 behavior is not a normal part of Slurp site refresh, so such requests will be rare.
ええと,存在しないURLを指定したのに「HTTP 200 OK(リクエスト成功)」を返すサーバがたまにあるのだけれど,そういうサーバの挙動を判断して,存在しないページを検索結果から削除するために10個の変な(404エラーになるであろう)URLをリクエストしてるんす.たまにね.
というようなことか.そのたまたまがウチの場合は今日だったのね,むしろなんとなくラッキー.

ていうか,いつもこういう感じのURLをリクエストよこすんであれば,むしろ SlurpConfirm404 というディレクトリを作成してテキトーな名前のファイルをたくさん置いといてあげますよ.偶然ヒットしたらいったい検索結果がどうなるのかが楽しみですウヒヒ

そうそう,404エラーと言えば404魂ここ?



RECENT ENTRIES
最近書かれた記事の新しいほうです
MONTHLY
記事を月毎にまとめてみました
CONTENTS
ABOUT IS.COM
このサイトについての注意及びその他
このサイトの制作者
hima image
ナマエ: hima(暇)
生息地: 青森県近辺
スペック: 確実に理系・aiko・パズルっぽいゲーム好き・貧乏暇だらけ・形から入りがち・道具好き・SONY・テレビっ子・B型に見られがち
    • idlingspace BBS

      Idlingspace.comに於ける掲示板。用途は不定,何でもOK
    • thumbnail in entry
      日記にイメージがあるもの一覧
    • all contents index
      Idlingspace.comの全ページリスト。日記と掲示板を除く

IS.COM banner image IS.COM banner
link to RSS RSS distribution
Get Opera browser Get Opera!
Get Firefox browser Get Firefox!
twitter my home follow me.
mixi my page join my-mixi
playlog my page my music style

IDLINGSPACE.COM
This site contains some informations, Ex games, hima, aiko, and so on.
"IDLINGSPACE.COM" is fabricated by 1996- hima. Linking with this site is always Free. Almost all rights reserved by hima, and I don't know who reserve the rights that weren't reserved by hima. And this site cannot guarantee that's all true.
You must not complain for no updating this site. You must not complain for that hobby differs from hima.


サイト内ケンサク

スクリプトエラーが発生することがわりとありますので,そういうときは慌てず騒がず「戻る」で戻ってきて下さい.


 
 Idlingspace.com for Mobile.
 http://m.idlingspace.com/
 ※パケット定額必須!!
ADV.