キーワードルール改定に関する意見というか雑感

陳腐化したキーワードについて

 これをシステム的に測るのはpv(ページ・ビュー)だと思います。
 誰にも見てもらえないキーワードこそが、手を入れるべきキーワードだと。
 あと、「陳腐化してるから削除」じゃなくて「陳腐化してるから更新して活性化」ですね。


 更新(頻度)は、陳腐化を防ぐ手段であって、陳腐化を測るバロメータではないと思います。
 それでもsasada案で、最終更新日をチェック項目に入れてるのは、最近更新されたキーワードは これからpvが増える可能性があるから、「経過観察」が必要との考えからです。

キーワードの属性について

 必要だと思います。
 品詞だけが注目されてるけど、「頻出語」や「ミスヒット多し」、「削除検討中」「誤爆回避用」など、過去住み分けが出来ずに発生したトラブルを避けたり受け入れたりすることも可能としたいところです。(http://d.hatena.ne.jp/sasada/./20020721#txt60)

三者言及性について

 第三者言及【可能性】をシステム的に測る術はないけれど、第三者言及【実績】は、「含む日記」に掲載されるIDの数を数えれば、ある程度は測れるのでは?
 メタ言及なども含まれるので正確なデータとはなりませんが、一定期間をおいて(ほとぼりが冷めた頃に)平均値を取れば、それなりの指標になると思います。


 第三者言及性は、その定義上、ダイアリー(+キーワード)からの言及を対象としており、Googleなどの はてな外部からの言及については触れていないことに留意すれば、上記の考え方で良いと思います。

リンクの有意性について

 情報量の少ないキーワードを測る手段としてリンクを用いる場合、リンクの数より そのリンクを辿ってキーワードが閲覧された数の方が相応しいと思います。
 “数”を判断基準にすると「頻出語」が有利になって意味がないので、なんらかの“率”、たとえば「リンクを辿った数」/「リンクが貼られた数」等が妥当と思われます。


 キーワードからの捕捉の価値を問うなら、「含む日記」からのリンク移動を(アンテナのように)捕捉しておいて、その割合で利用率を測る手もあります。

はてなグループのキーワードの自動リンクについて

 これはアウターキーワードシステムのことかもしれないし、その簡易版かもしれないですね。
 いずれにせよ、リンクにつけるクラスには、okeywordと共に引用元グループを表すクラスも欲しいです。ソレによって、表示も変えるだろうし、html的な意味も変わると思う。
 あと、言及元を明らかにするためにtitle属性をつけておくと良いかもしれません。


 グループキーワードなどの外部キーワード側から、ダイアリーの「含む日記」に相当する捕捉機能を実現する方法(いっそ、ググるか?)と、見栄えの良い手動リンクの方法が課題?



 以下、続くかもしれませんが続かないかもしれません。
 翌日の日記に続いてます。