おれ かきすてる おまえ よむ

ぶんたい いろいろ いちにんしょう ばらばら でも それでいい きにするな おまえ つよくいきろ それでいい

日本人の日本人による日本人のためのタグ付けルール

今回は、はてなブックマークの使い方、特にタグの付け方やコツについてのおはなしです。

はてブってタグが付けられるじゃないですか。でもタグって付けるの難しいじゃないですか。表記揺れだらけで検索インデックスとして役に立たなかったりするじゃないですか。やっぱり外部記憶装置として活用するなら検索性がクソじゃあ意味がないじゃないですか。

それじゃもったいないので、個人的に成功しているタグの付け方をここに書いておこうかなと思う次第じゃないですか。

あ、これってタグ管理型データベースの検索性を向上させるという話なので、はてブに限らずEvernoteとかなんとかいろんな物に応用可能だと思うじゃないですか。

基本思想

全体の思想としては、次の2点を意識する。頭の片隅において続きを読むと理解しやすいと思う。

タグ付けが難解・面倒でないこと
タグ付けの障壁が高いと、ああもうめんどくせえな、とタグ付けもブックマークも投げ出してしまうことになる。
検索性を高めること
いざ検索しようという時に思い通り情報が引き出せないのでは、外部記憶データベースとしての価値がない。

タグは基本的に英語表記にする

表記揺れはタグ型管理の最大の敵だ。撲滅せねばならない。

日本語を使用する限り、表記揺れは解決不能だと思う。漢字か平仮名かカタカナかとか、送り仮名どうするとか、プリンタなのかプリンターなのかとか、渡辺なのか渡邉なのか渡邊なのか、タマゴが先かニワトリが先か…悩みは尽きない。

しかし、全て英語にしてしまえば、さっくり9割くらいは解決する。

日本人なのに英語でタグ付けなんてめんどいよと思うかも知れないが、実際に運用してみると、表記揺れのせいで日本語の方が超ミラクルハイパークソめんどいのである。

なお、あくまで「基本的に」である。上手く対応する英単語がないこともあるので、そこで無理をする必要はない。たとえば私は[matome]というタグを使用している。便利なサービスまとめ、話題のあの事件に関するまとめ、みたいなものに使いやすい。databaseってほど大げさではないし、listやresourceなどとすると曖昧すぎて検索インデックスとして機能しないので、「まとめ」という日本語をそのまま当てるのは適切に思う。

附記: 英語の表記揺れ

英語様と言えど当然、表記揺れが皆無ではない。

  • 通例複数の単語
  • 名詞形よりも-ingの動詞形で使いがちな語
  • 元の単語よりも短縮形の方がメジャーな語
  • アメリカ英語とイギリス英語(と和製英語)

などなど。こういったものは、検索する時のことを考えて対処するとよい。

たとえば「troubleshoot」と検索した時、[troubleshoot]と[troubleshooting]は両方まとめてヒットしてくれる。しかし「troubleshooting」と検索したら、[troubleshoot]は引っかからない。よって、[troubleshooting]とタグ付けしておくと検索性が高いだろう。

要するに、英語や文法としての正しさよりも、検索性や入力性の方が圧倒的に優先すると考えるのがベターだ。

連語や合成語はハイフンで接続する

例示から示せば、はてなダイアリー関連のページをブクマするならタグは[hatena-diary]とするよ、という話。

株式会社はてなの歴史について述べた記事と、はてなダイアリーの使い方について述べた記事があるとする。前者に[hatena]タグ、後者には[hatna][diary]と2つのタグを付けてしまうとどうなるか。

のちのち株式会社はてなについての記事を引き出す際、[hatena]で検索すると、はてなダイアリー関連の記事まで一緒に出てきてしまう。マイナス検索は有料機能であるし、使用可能だとしても[diary]を除外、[bookmark]を除外、[haiku]も除外、[blog]も…とやっていたらキリがない。

また逆に、来年使いたい素敵な手帳をブックマークしておいたのに、いざ購入シーズンになって[diary]タグから探そうとしたらはてなダイアリー関連のブクマが大量に吐き出されて絶望、なんてこともあるかも知れない。

つまり、連語や合成語はまとめてひとつの意味を示すものであって、分解してしまうと違う意味になってタグの衝突を招く、ということだ。単語間をハイフンなどで繋ぎ、1つのタグとしておこう。

なおこの場合、はてブの件もはてダの件も全部一気に見たいねん、というケースでは「[hatena」を検索語にするといい感じになる。

(それを意識すると、うごメモはてな関連記事は[ugomemo-hatena]よりも[hatena-ugomemo]の方が便利だな、という話もあるがお好みで。これは合成語の話というよりはディレクトリ型管理の話だ。誤解されがちだが、タグ型管理とディレクトリ型管理は共存可能である。)

ちなみに、[web design]のように空白でまとめるのはやめたほうがよい。サードパーティーアプリなどでは空白をタグ区切り子として扱ってしまうことがあるからだ(もちろん実装の方がクソなのだが、文句を言っても仕方がない)。

ブックマークコメントも活用する

タグでは上手く表現できないことは、コメント欄を活用してねじ込んでおくといい。個人的には、どうしても英語タグではなく日本語で書いておきたいことはコメント欄に入れるようにしている(ちょっといまいい例示が思い浮かばなくてすみません)。

のちのち検索する時にはこういった日本語を使って絞り込みしそうだな、と考えて入れておいたメモが役立つシーンは多い。また、タグ検索では上手く引っかからず、「あの記事を読んだ時にはこんな感じのコメントを書いた気がする」という記憶の手掛かりから検索が成功することもよくある。

とはいえ最優先は気軽にブックマークしてデータベースに入れておくことなので、無理に毎回コメントを書く必要はないと思う。

プライベートタグ

プライベートな用途のタグを用意したい時がある。例えば、「あとで読む」タグなんかがそうだ。あれは検索インデックスという意味合いとは異なるが、タグ付けしてまとめておきたいのはわかる。また、これ欲しい!というものを「ウィッシュリスト」なんてタグにまとめておくのもナイスである。

こういうのはあくまで「自分があとで読む」とか「自分が欲しいもの」であって、[read-later]などとタグ付けすると、PocketやInstapaperのような「あとで読む系ウェブサービス」についてのブクマと混ざってしまうかもしれないといった恐怖がある。

…いや、書いていたらそんなことはない気がしてきたが、要するに、プライベートタグと通常のタグは何らかの手段で区別しておいた方がよい、という話である。

通常のブックマークとのタグ衝突を防ぐには、例えば、あえて日本語表記にするといった方法が考えられる。このようなプライベートなタグは種類も少ないだろうから、英語表記にこだわらずとも表記揺れで混乱することはないだろう。

加えて、もうひとつ。プライベートなタグは、タグの頭に半角記号を付けておくと便利だ。

例えば[*あとで読む]なんて風にしておくと、ブックマーク画面のアルファベット順タグソートで先頭に表示される。これによってあとで読みたい系エントリを秒速で仮ブックマークすることが可能となり、古今東西の英語学習法を24時間365日休むことなく掻き集めて山手線ゲームでの完全勝利を目論む意識高い系村民などは歓喜し平伏しむせび泣きながら[*あとで読む]して、結局読まないであろう。

特定のタグでブックマークすると自動的にプライベートブックマークになる機能とか実装されないかなあ。

まとめ

  • 基本的に英語でタグ付けする
  • 連語や合成語はひとつのタグにまとめる
  • コメント欄も活用する
  • 特殊なタグの頭に記号を付けるとハッピー

それでは素敵なタグ付けライフを!