木っ端拾いの材木流し

Cannot see the wood for the trees.

セクションカテゴリ捕捉用キーワード [はてな]

メリットもデメリットも感情論も一通り出揃ったと思うので、はてなへの公開質問状みたいなのを作ってみました。半分は自分の整理のためで、もう半分はせっかくの時に結局誰も聞かなかった*1はてなの公式見解というのを聞いてみたかったからです。
余り大勢で推敲すると聞きたいことがぼやけてしまうので、ここで公開するのは「こういう質問をするよー」という表明だと思ってください。もちろんコメントは歓迎しますが、基本的にはこのまま出そうと思っています。
あと、何人かの方の日記へのリンクを含みますので、引用のされ方に問題があるとか引用して欲しくない(勝手に味方にするな!とか)という方はご連絡ください*2はてなへの質問からは外させていただきます。
逆に自分の意見も支持/反対派として引用していいという方がいましたらご連絡ください。


(有)はてな 御中
平素よりお世話になっております。はてなダイアリーを利用させて頂いているwushiという者です。
本日ははてなダイアリーで最近登録されている「セクションカテゴリ捕捉用キーワード」というキーワードとその子キーワードについて、はてな運営サイドの皆様の見解をうかがいたく、ご連絡させていただきました。


セクションカテゴリ捕捉用キーワードとは
セクションカテゴリ捕捉用キーワードとは、キーワードで日記をつなげるように、小見出しのセクションカテゴリ(例:[hatena])で同じカテゴリーの日記をつなげるために登録されたキーワードです。「キーワードを含む日記」を「カテゴリを含む日記」として擬似的に機能させるものです。


■背景
現状の「キーワードを含む日記」を検索する機能の場合、例えばマクロメディア社のFlashを話題とする日記を探すために「Flash」というキーワードを含む日記を検索すると、本文に「Flash以前に使われていた技術」と書かれたJavaアプレットを話題とする日記にもヒットしてしまいます。
これに対して、小見出しのカテゴリに「[flash]」と書かれた記事は、筆者がFlashを話題とすることを明示的に宣言していると言えます。このため、「[flash]」というカテゴリーを含む複数の人の日記を検索することができれば、本文の文字列に関わらずFlashの話題を扱う日記を高い精度で検索できると考えられます。


■方法
理想としては、はてなダイアリーのシステムに「カテゴリを含む日記」を検索する機能が実装されるのが望ましいと思います。これははてなへの要望とさせていただきたいと思います。
今回はてなスタッフの皆様の見解を頂きたいのは、「[カテゴリー名]」というカギ括弧込みのキーワードを登録することで「キーワードを含む日記」を擬似的に「カテゴリを含む日記」として機能させる方法についてです。


■この方法のメリット
この方法では、先のFlashの例だと「[flash]」というキーワードを登録します。こうすると単に「Flash」という文字列を含む日記は捕捉されず、「[flash]」というセクションカテゴリの日記(および、まれではありますが本文中に[flash]という文字列を含む日記)だけが捕捉されます。このため、キーワードを捕捉する場合に比べてより高い精度でFlashを話題とする日記を検索する事ができます。


■この方法を有益だと考えるユーザー
今回のカギ括弧付きのキーワードは、はてなキーワード登録ルールにある「普通名詞」ではなく、特殊な文字を含むため「キーワードに適した固有名詞」とも言いがたいものです。このため、現行のルールの枠内で登録が許可されるためには少なくとも「多くのユーザーにとって有益であるため固有名詞化されたキーワード」でなければなりません。
現時点で、この方法の有益性を認める記述が以下の方の日記で見られます。
http://d.hatena.ne.jp/mitty/20031123#p1
http://d.hatena.ne.jp/smoking186/20031121#1069423074
http://d.hatena.ne.jp/rakka/20031123#1069574486
また、参考として、はてなアンテナに「日記の特定のカテゴリー」を登録する人が以下の方の日記で確認されています。
http://d.hatena.ne.jp/rakka/20031123#1069573743
http://d.hatena.ne.jp/mitty/20031124#20031124f6
[カテゴリー名]をキーワード化する方法は、これらの人にとっても有益であると考えられます。


■この方法によって考えられる害
[カテゴリー名]をキーワード化する方法によって発生しうる害として、次のようなことが考えられます。
・日記上でセクションカテゴリがキーワードとして補足されていることが視覚的に見えない
 セクションカテゴリがキーワードとして捕捉されていることは「コメントを書く」あるいは「編集」の画面を見れば判別可能ですが、ぱっと見では判らないため、隠れて捕捉しているという印象を与える恐れがあります。
・捕捉対象から外す手間が大きい?
 セクションカテゴリははてなのシステムの一部であり、使用する機会は多いと思われます。このため、セクションカテゴリを捕捉されることを嫌う人がいた場合、いちいち対象キーワードから外すのに手間がかかることが予想されます。
・システムに負荷がかかる?
 これははてなのシステムへのご質問となってしまいますが、例えば「[flash]」と「Flash」の両方がキーワード化されていた場合、キーワード抽出時に「[Flash]」という文字列に対して「[flash]」と「Flash」の2回抽出してしまうのではないかと危惧しています。また、一般的なカテゴリー名がキーワード化されると抽出対象の日記が多くなって、抽出に負荷を与えることが予想されます。


はてなへのご質問
以上を踏まえて、はてなスタッフの皆様に次の3点についての見解をうかがいたいと思います。
1. 「セクションカテゴリ捕捉用キーワード」およびその子キーワード(例:[flash])が、「多くのユーザーにとって有益であるため固有名詞化されたキーワード」に該当すると言えるか(現行のルールの枠内であるか)
2. 現状で考えられる害は、この方法を禁止するほど重大であると考えるか(被害があると考えるか)
3. 1と2を総合して、セクションカテゴリ捕捉用キーワードをキーワードとして登録することを、はてな運営側は認めるか、禁止するか、あるいはユーザーの判断に任せるか


はてなのサービスの今後の発展をお祈りしております。
乱文乱筆お許しください。

*1:やっている人がいたら結果とか教えていただけるととても嬉しいです。

*2:ここで公開するなら一緒じゃん、と言われるかも知れませんが。