木っ端拾いの材木流し

Cannot see the wood for the trees.

続・2ch-blogのPageRank

http://d.hatena.ne.jp/wushi/20040103#p1 の続き。
先日tskmryさんに教えて頂いた時は「こんなリンク集サイトもあるんだなぁ」位の認識しかなかった(注:失礼です)のですが、ちょっと調べてみるとこのページが関係ありそうな気がしてきました。
Googleで語句ではなくURLのみを入力して検索すると、そのURLのページがひとつだけヒットして、そのページのキャッシュ、そのページに関連したページ、そのページへリンクしているページ、そのページのURLを含むページを検索することができます。(例:私の日記のURLを入力した場合
ところが、2ch-blogのトップページのURLを入力すると、このような結果になります。タイトルとサマリーは2ch-blogのトップページのものですが、リンク先は
http://aranxp.ddo.jp/modules/mylinks/visit.php?cid=3&lid=25
になっています。キャッシュ、関連したページ、リンクしているページ、含むページもこのURLになっています。ちょっと変です。
では、上記のURLはどんなページなのでしょうか?上記のURLをブラウザで直接入力しても、http://www.2log.net/に飛んでしまうので、可能性としては

  • meta タグで refresh を指定したHTMLを出力している
  • HTTP レスポンスヘッダー Refresh で転送している
  • HTTP 301 か 302 で転送している

あたりが考えられます。*1 上記URLへのリンクを書いたHTMLを作ってブラウザで表示し、リンクを右クリック→対象をファイルに保存します。telnetで直接HTTPレスポンスを取得した方がより確実ですが、今回はこれで十分でした。結果はこんな感じ。

<html><head><meta http-equiv="Refresh" content="0; URL=http://www.2log.net/"></meta></head><body></body></html>

metaタグだけのHTMLを返しています。
さて、この転送するだけのHTMLに何か問題があるのか?「google pagerank meta refresh」でGoogle検索すると、下のような情報が。

やってはいけないこと2

 これは、検索エンジンに登録するときに自分のHPはひとつしか登録できません。そこで、ダミーのHPをたくさん登録して本来のHPに自動でジャンプするようにしたものです。 (中略) 通常は、ほんとうのHP(省略)のみ登録するのですが、あわよくばA、B、Cのどれかに検索でひっかかったら自動的に自分のほんとうのHPに飛ぶように仕組むわけです。A、B、Cには、次のような自動ジャンプタグを組み込んであります。

<META HTTP-EQUIV="refresh" CONTENT="0;URL=(省略)">

refreshとは「再読み込みせよ」という命令です。「0」は、「0秒後にURLのHPに飛べ」というときの時間です。こんなふうにダミーHPをたくさん作っておけば、それだけ自分のHPに人が来る確率が上がるわけです。ただ、この仕掛けもアメリカでは、あまりにも氾濫したためGoogleでは対策を講じています。

どうもmetaタグのrefreshが検索エンジンスパムとみなされる場合があるようです。
これだけで決めるのは早計ですが、2ch-blogトップページのPage Rankが0なのと関係があるかも知れません。
ただ、上記のリンク集サイトには2ch-blogより後発のDoblogも登録されているのですが、DoblogにはちゃんとPageRankが付いています。なんだろうなー。
(追記)

  1. Google2ch-blogトップページのURLとしてhttp://www.2log.net/でなく問題のURLを登録
  2. http://www.2log.net/へのリンクがすべて問題のURLへのリンクとしてPageRankが計算される
  3. http://www.2log.net/PageRankが上がらない

というのはありえるのかな・・・
(追記)
はてなダイアラーリファラの実験をしている方を発見。
リファラ実験 (日記:id:kosekiさん)
よく見たら、リンク元ビューアの作者の方でした…よく使わせて頂いてます m(_ _)m

*1:HTTPサーバーからの応答にレスポンスヘッダー Refresh があると、ブラウザはこのヘッダーで指定されたURLにリクエストを行います。この技術をクライアント・プルといいます。HTMLにmetaタグにrefreshを指定した場合も、同等の動作を行います。この時ブラウザのアドレス欄には、再リクエストを行った(=転送された)URLが表示されます。参考:とほほのWWW入門SMART