http://d.hatena.ne.jp/wushi/20040103#p1 の続き。
先日tskmryさんに教えて頂いた時は「こんなリンク集サイトもあるんだなぁ」位の認識しかなかった(注:失礼です)のですが、ちょっと調べてみるとこのページが関係ありそうな気がしてきました。
Googleで語句ではなくURLのみを入力して検索すると、そのURLのページがひとつだけヒットして、そのページのキャッシュ、そのページに関連したページ、そのページへリンクしているページ、そのページのURLを含むページを検索することができます。(例:私の日記のURLを入力した場合)
ところが、2ch-blogのトップページのURLを入力すると、このような結果になります。タイトルとサマリーは2ch-blogのトップページのものですが、リンク先は
http://aranxp.ddo.jp/modules/mylinks/visit.php?cid=3&lid=25
になっています。キャッシュ、関連したページ、リンクしているページ、含むページもこのURLになっています。ちょっと変です。
では、上記のURLはどんなページなのでしょうか?上記のURLをブラウザで直接入力しても、http://www.2log.net/に飛んでしまうので、可能性としては
- meta タグで refresh を指定したHTMLを出力している
- HTTP レスポンスヘッダー Refresh で転送している
- HTTP 301 か 302 で転送している
あたりが考えられます。*1 上記URLへのリンクを書いたHTMLを作ってブラウザで表示し、リンクを右クリック→対象をファイルに保存します。telnetで直接HTTPレスポンスを取得した方がより確実ですが、今回はこれで十分でした。結果はこんな感じ。
<html><head><meta http-equiv="Refresh" content="0; URL=http://www.2log.net/"></meta></head><body></body></html>
metaタグだけのHTMLを返しています。
さて、この転送するだけのHTMLに何か問題があるのか?「google pagerank meta refresh」でGoogle検索すると、下のような情報が。
やってはいけないこと2
これは、検索エンジンに登録するときに自分のHPはひとつしか登録できません。そこで、ダミーのHPをたくさん登録して本来のHPに自動でジャンプするようにしたものです。 (中略) 通常は、ほんとうのHP(省略)のみ登録するのですが、あわよくばA、B、Cのどれかに検索でひっかかったら自動的に自分のほんとうのHPに飛ぶように仕組むわけです。A、B、Cには、次のような自動ジャンプタグを組み込んであります。
<META HTTP-EQUIV="refresh" CONTENT="0;URL=(省略)">
refreshとは「再読み込みせよ」という命令です。「0」は、「0秒後にURLのHPに飛べ」というときの時間です。こんなふうにダミーHPをたくさん作っておけば、それだけ自分のHPに人が来る確率が上がるわけです。ただ、この仕掛けもアメリカでは、あまりにも氾濫したためGoogleでは対策を講じています。
どうもmetaタグのrefreshが検索エンジンスパムとみなされる場合があるようです。
これだけで決めるのは早計ですが、2ch-blogトップページのPage Rankが0なのと関係があるかも知れません。
ただ、上記のリンク集サイトには2ch-blogより後発のDoblogも登録されているのですが、DoblogにはちゃんとPageRankが付いています。なんだろうなー。
(追記)
- Googleが2ch-blogトップページのURLとしてhttp://www.2log.net/でなく問題のURLを登録
- http://www.2log.net/へのリンクがすべて問題のURLへのリンクとしてPageRankが計算される
- http://www.2log.net/のPageRankが上がらない
というのはありえるのかな・・・
(追記)
はてなダイアラーでリファラの実験をしている方を発見。
リファラ実験 (日記:id:kosekiさん)
よく見たら、リンク元ビューアの作者の方でした…よく使わせて頂いてます m(_ _)m