検索と名づけの話

検索汚染

10年ほど昔の話だが、「マスドライバー」という単語を調べたくて、インターネットで検索してなかなか目当ての情報が出なくて困ったという体験がある。ちなみにマスドライバーというのは宇宙に物資を打ち上げる手法のひとつで、自身に積んだ燃料を燃やしながら推進するロケットとは違って、地上で必要な速度まで加速してそのまま放り投げる(物資自身は推進能力をもたない)というものだ。

どう困ったかというと、マスドライバーが作中の兵器として登場するアニメ「機動戦士ガンダム」および「機甲戦記ドラグナー」シリーズの情報がヒットしまくり、現実的な技術や理論としてのマスドライバーの情報に全然リーチできなかったのだ。

ぼくはこのときNOT検索(-(マイナス)を除外したい単語の前につけると、結果からその単語を含む候補を消せるという検索構文)を覚えた。

マスドライバー -ガンダム -ドラグナー

と検索して目当てのものに近いWebサイトを発見できたのは、ぼくのインターネット原体験のひとつとしてよく記憶している。

このように、単語が他の意味をもつことで調べたい意味で調べにくくなることは検索汚染と呼ばれているそうだ。

現代では、〈艦隊これくしょん〉シリーズ人気によって歴史上の艦艇名を検索したいのに美少女キャラクターばっかり出てきたり、〈Fate〉シリーズ人気によって歴史上の人物の名前で検索すると、歴史上のエピソードではなく〈Fate〉内のキャラクターについてのエピソードばかり出てきてしまうのは人によってはけっこう深刻な問題みたいで、ミリタリーや世界史のマニアが怒っている光景もしばしば見る。

ググラビリティ

検索汚染の逆が、「新しく作ったものに「よくある名前/すでに有名なものの名前」をつけてしまったために、その新しいものが検索にかかりにくい」という状況だ(汚染する側になるとも言える)。

有名な例は、プログラミング言語であるJulia(同名のAV女優がいる)や、統計解析に特化したプログラミング言語R(アルファベット1文字なので競合候補が多い)だろう。どちらもかつては言語名だけではあまりヒットせず、「言語/lang」を追加でつけて

Julia 言語

というように検索していたらしい。

現在では需要の増大や他勢力との力関係が変わったのか、Julia/R単体でも、検索結果はプログラミング言語のページ一色である。

これらの単語は「汚染」に成功したのだ。

検索界ではGoogleが強すぎて"google"は英語で「検索する」を意味する動詞になっていて、このような「ワードのもつ、その意味で用いているページへの到達のしやすさ」もgooglability(ググラビリティ、検索性)という言葉で概念化されている。

最近ではCOVID-19感染防止のためのアプリ「COCOA」が一般的な単語と同じスペルでググラビリティ低いよね、と話題になったのは記憶に新しい。

Image
文法的に誤ったタイトルを使うと検索上不利かもしれない

現代的な "名づけ"

昨今は子どもにつける名前が多様化していわゆる「キラキラネーム」などと呼ばれているが、これもWebで世界中の情報が一覧される時代の影響なのかも、という妄想がある。
というのも、独自性の高い名前であるほど、広大なWeb上の世界でも名前とその人物の名前の同一性が担保されるからだ。

ただし、本名で検索したとき、その人物のライフヒストリーの一部が見える(何かで表彰されていたり、ニュースになったことがあったり)のにはもちろん悪いところもあって、トレーサビリティが高いばかりに知られたくない情報を知られてしまうことも少なくないだろう。

検索によって現代的な名づけの方法論は実は昔とはかなり違ったものになっていて、もっとそういうことに意識的になってもいいかもしれない、と考えた。