人間乱数についての覚え書き - セミになっちゃた

人間乱数

人間に「乱数列を書いてください」と頼むとけっこう変な偏りをもった数列を書いちゃうらしくて、人間乱数とか human random number generation とか呼ばれているようである。これがなかなかにおもしろい。
今回は、人間乱数の性質や成り立ち、その利用などについて、ちょこちょこ調べたことをいろいろ紹介してみようと思う。

ブツ切り傾向

いちばんわかりやすい例が「コイントスを１００回やったときにできる裏表の列を想像して書いてみてください」というもの。

人間が書いた乱数列は、コインの裏表それぞれの頻度こそだいたい50:50になるものの、「裏が出た次の回に表が出る確率」および「表が出た次の回に裏が出る確率」、つまり「コインの裏表が入れ替わる頻度」が期待値（0.5）に対して異様に高くなるらしい。

2006-08-24

これはギャンブラーの誤謬と呼ばれる現象があらわれたものと見ることができる。ギャンブラーの誤謬とは「表が連続しているから、そろそろ裏が出るはず」というように、実際には独立な事象に対して「確率の揺り戻し」があると考えてしまうバイアスのことだ。このバイアスによって、裏と表の連続が必要以上にぶつ切りにされてしまうわけである。

引用したブログでは、人間は「何回も連続して何かがおこること」の発生確率を実際より少なく見積もるので、単なる乱数列のゲーム結果に対して「流れ」や「ツキ」を見いだしてしまうのではないかと結論している。スポーツ選手が連続してうまくシュートを決めるように見える「ホットハンド理論」とも強く関連したもので、非常に重要な指摘のように思う。

手前でも適当にコードを書いて生成してみたが、たしかに上の「正しいコイントス（表裏の入れ替わり確率50％）」よりも下の「入れ替わり過剰なコイントス（表裏の入れ替わり確率65％）」のほうが自然なように感じる。

「期待される頻度」に寄る傾向

人間が書いた乱数コイントスの裏表の頻度はだいたい50:50になる、と書いたが、実はここでも、人間乱数と正しい乱数のズレがある。100回コイントスをすると、40％くらいの確率で裏表に10個以上の差がつく（45:55／55:45以上に偏る）のだが、人間乱数ではこういったことは起こらず、50:50に近い出現頻度をとりがちな性質があるのだ。

この現象は、コイントスよりもちょっと複雑なタスク、「サイコロを何回も振った出目（1～6）を想像して書いてください」を人間にお願いしたとき顕著に見えるようだ。

http://blog.livedoor.jp/lunarmodule7/archives/4523745.html

引用したページでの

F1: 全体で出た目の回数のχ2値(5.0)

がこれにあたり、「頻度の期待値（1/6）への近さ」を表している。χ2値が理論値に対して人間乱数が半分の値を取っていることから、人間乱数には均等すぎるという性質があることがわかる。

これは小数の法則と呼ばれるバイアスに関連した現象のようである。「小数の法則」は、数学の定理である「大数の法則」をもじったもので、大数の法則が「無限回試行を繰り返せば頻度は期待値に一致する」（意訳）のに対して、「試行回数が少ない場合でも、頻度が期待値に近くないと不自然に感じる」バイアスのことである。

人間の思う乱数と実際の乱数がズレるそもそもの理由

ここまでで「連続するイベントを切りがち」「出現頻度を過剰に期待値に寄せがち」という二つの人間乱数の特徴を紹介した。じゃあ、なんで人間はそんなに乱数作るの苦手なんだよ、と考えると、どうも（進化の過程で遭遇してきた）現実世界のイベントはたいてい独立事象じゃないから説があるようだ。

Frontiers | The Gambler’s Fallacy: A Basic Inhibitory Process?

該当箇所を引用しよう。

The answer may stem from the probabilities associated with particular events and outcomes in both the real world and the casino. In a casino, outcomes are designed to be random whereas in the real world this is usually not the case. For example, when we developed the evolutionary account of IOR using the apple-picking scenario, we postulated that apple pickers inhibit an area of visual space, or perhaps an action associated with a just-picked-apple, in order to turn their attention to new locations and new apples. In fact, the probability of a new apple being in the same location as a just-picked-apple is zero (at least until next year). That is, the probability of event N + 1 is contingent on event N.

（中略）

The cognitive and neural systems that support performance in the real world cannot be expected to contribute to optimal outcomes in an artificial environment where the probabilities of one event are not contingent on previous events (i.e., the casino where outcomes are random).

論文中では「樹からリンゴを取ったら同じ場所からはリンゴが取れなくなる（N番目の状態とN+1番目の状態が相関している）」例が挙げられている。
この例の妥当性は措くとして、まあ同じ独立事象が何回も繰り返されるようなことが自然界であるかと言われれば、たしかにあまりなさそうである。リンゴに限らずリソースは「取ると減る」ものなので、ブツ切り傾向と対応している……と言われればそうかもしれない。

最後の部分は「現実世界におけるパフォーマンスを支えるための認知／神経システムが、イベントが独立に発生する人工の環境（たとえば、カジノ）において最適な成果を出すとは期待できない」といったところ。
「イベント発生が独立でない世界（自然界）」で獲得したメソッドを「イベント発生が独立な世界（ギャンブル）」に持ち込んでしまっているから齟齬が生じるのだとすれば、人間の脳は成り立ちのレベルでギャンブルに向いてないように思われる。

「人間の（一見）不合理に見える性質は、実は進化の過程で何かに適応した結果獲得したものである」をテーマに一冊、一般向けの本が"The Rational Animal: How Evolution Made Us Smarter Than We Think" ／『きみの脳はなぜ「愚かな選択」をしてしまうのか意思決定の進化論』のタイトルで出ている。パラパラ読んでみたところ、サルにも損失回避（プロスペクト理論といって、同額の利益と損失では損失を過剰に高く評価する）の性質があるなど、興味深いトピックが紹介されていた。

人間のもつバイアスと成長

では、これらの乱数へのバイアスを人間が「生まれたときから持ってる」のか、それとも「成長するうちに獲得する」のかというと、これは一口には言えないようだ。

少し話題が逸れるが、確率に関するいろいろな問題をアメリカのGrade 5, 7, 9, 11の学生（小５、中１、中３、高２にだいたい対応）に回答させた研究があって、成長にしたがって減少するバイアスと、成長にしたがって増加するバイアスがあるようだ。

https://www.jstor.org/stable/pdf/749665.pdf

成長して増大するバイアスの中で特に劇的なのが、

Q コインを3枚投げてうち2枚以上が表である確率は、コインを300枚投げてうち200枚以上が表である確率と比べて
① 小さい
②同じ
③大きい

という問題。
正解は「③大きい」なのだが、成長するにしたがって②が増え、③が減るというバイアスの強化がおこっている。子どもの頃は間違えなかった問題を成長するにつれ間違えるようになっていくのには奇妙な印象を受ける。

もうひとつが「Time axis fallacy」（あるいは同型の問題であるモンティホール・ジレンマのほうが通りがいいかもしれない）で、

AさんとBさんが、それぞれ白い石と黒い石が２つずつ入った箱をもらいました。

Q1 Aさんが箱から石をひとつ引くと、白い石でした。石を箱に戻さずに次の石を引いたとき、白い石が出る確率は、黒い石が出る確率よりも
① 小さい
②同じ
③大きい

Q2 Bさんは箱から石をひとつ引いて、色を見ずに脇に置きました。二つ目の石を引くと、白い石でした。一つ目の石が白い石だった確率は、黒い石だった確率よりも
① 小さい
②同じ
③大きい

という問題。

正解は「Q1. ①小さい、Q2. ①小さい」なのだが、成長するにしたがって、Q2のほうで②同じの回答が増えるというバイアスの強化がおこっている。

Q1. については言わずもがなだが、Q2. で「②同じ」と回答してしまうのは「後に引いた石の色が前に引いた石の色に影響を及ぼすはずがない」という考えにミスリードされるから、という説明がなされているようだ。（実際は二つ目の石の色が何だったかという「手がかり」が与えられることで、一つ目の石の色をより正確に予想できるようになる。）

年齢とともに因果関係を過信するようになって問題を間違えやすくなる傾向があるのはおもしろい。

人間乱数と成長

人間乱数そのものについて、8歳と10歳に0～9の乱数列を書かせてみた研究があるようだ。

An exploration of random generation among children

TPIという指標（相関が強ければ強いほど大きくなる）が8歳から10歳になると大きくなっていて、成長にしたがって「正しい乱数からのズレが拡大している」のがわかる。

「ある数字を書いた次にどの数字を書いたか」のグラフが以下のものだ。

An exploration of random generation among children より引用

グラフは「前の数字との差」を示していて、5の次に6を書いたら+1、5の次に0を書いたら-5、ということになる。0の部分に大きな谷があるので、人間が「同じ数字の連続」を異様に避けるのが読み取れる（どうせなら、iからjへの遷移確率の行列をそのまま見たいが……）。
8歳の+1の部分に大きなピークがあるのも要注目で、数を習って間もない8歳児がついつい「4567……」のような連続して1ずつ増えるシークエンスを書いちゃっているということで、ほほえましい。

逆にバイアスにあわせる

上で紹介したブログで、ファイアーエムブレムの確率表示のかなり興味深い工夫が書かれている。

たとえば、ファイアーエムブレムシリーズの封印の剣、蒼炎の軌跡、新・暗黒竜と光の剣では、攻撃命中率が表示されるにも関わらず実際の命中確率は、表示が50%以上の時には表示よりも高く、表示が50%以下の時には表示よりも低くなるように調整されている。これにより、90%なのにやたら攻撃が外れるとかいうプレイヤーの不満を減じることができる。

これは「ブツ切り」とも「平均化」とも違ったもので、「90％と言われたとき、90％以上の確率を想像してしまう」認知バイアスがあるようだ。

そういえば、ポケットモンスターのゲームは表記通りの確率を用いているが、「ねむりごなは表記75％だけど絶対そんなに当たってない」「ハイドロポンプの80％はウソ」といった「表示されている確率と体感確率が違う」話がよく聞かれる。

この背後には「重要な局面での高命中技の失敗」「ダメ元でやった低命中技での逆転劇」などが印象的で記憶に残りやすい、といったバイアスがありそうである。

実装した例は知らないが、たとえばゲームにおけるアイテムのドロップ率を「人間乱数にあわせた（自然な印象をうける）ものにする」ことは可能なはずだ。
1％の確率でドロップするアイテムがあるとしよう。直感的には「100回チャンスがあったら出そう」と思いがちだが、100回やって1％のものが出る確率は実は63％程度しかない（期待値は1になるが、これは2回以上ドロップした人によって値が押し上げられているため）。
はじめのほうのドロップ率を1％以下にして、以後は試行回数にしたがってドロップ率が上昇するように設計すると、（2回以上ドロップする確率を押し下げることで）期待値を保ったまま「100回チャンスがあったらだいたい出る」アイテムドロップが実装できるはずである。

かつてソーシャルゲームの有料ガチャの確率操作が問題になっていたが、これは公平性の問題であって、確率カーブを調整すること自体が悪なわけではない。
競技むけのゲームでもない限り、コンシューマゲームの「人間向けにチューニングした「快適な」確率」はどんどん工夫をこらしてやっていいと思うし、そういった話をいろいろ聞いてもみたい。

※追記
記事を公開して、「ランダムエンカウントのゲームで、戦闘後、一定歩数までエンカウント率を0にするという工夫はこれに当たるのではないか」との指摘をいただいた。これを実装しているという話はけっこう聞くように思う。
敵の出現確率が定数なら「戦闘後すぐに次のバトルがはじまる」ことも当然あり得るのだが、これを人間が「不自然」と感じるのももっともかもしれない（なぜなら現実界での「敵の分布」は一様ではないので）。
ただ、単にすぐ次のバトルがはじまるのは煩わしいのでユーザーエクスペリエンスを損なう、という側面もあるだろうとは思う。

シンボルエンカウントのゲームでは敵は「ある広さのエリアごとに一匹」というふうに配置されることが多く、これが生き物の「縄張り」と対応していると見ると、ある意味「自然な配置」かもしれない。

メダルゲームと標本平均の収束

「人間が自然に感じるように」とも「利益を最大化するように」とも別の方向で確率の動的な操作を行ってきたゲームのジャンルがある。メダルゲームである。
http://iroirogames.blog.jp/archives/8921473.html

メダルゲームの機械には、週や日の単位であまり成績にバラツキが出てほしくない事情があるそうだ。
ここでいう成績というのはペイアウト（投入するメダルの割合に対する放出するメダルの割合）のことで、管理コストの都合上、これが日によらず一定になってほしい、とのこと。ギャンブルと違って公平性を厳密に守る必要がないので、履歴に応じた確率操作を行ってパフォーマンスを安定させているのである。

ある時間単位で頻度が過度に期待値に近づくわけで、傾向としてはまさに「小数の法則」が対応する。

日単位で収束することを利用して、一日中記録をとって閉店間際に勝てるかどうか予測できる（あるいは、予測して勝った）話を聞いたことがあるが、ここまでくると眉唾ではある。

バイアスが強化される可能性

ゲーム内で使う人間向け確率なり、メダルゲームの収束機なりによって「チューニングされた確率」に慣れちゃうと、逆にふつうの乱数へ持つ違和感が今以上に増大する可能性はありそうだ。ほどほどにしたほうがいいかも。

どうでもいい話

中にコンピュータと可動おもりをいれて確率のある程度の操作を可能にした、「人間乱数実装サイコロ」ができたらちょっとおもしろいかもしれない。

「対戦チンチロリン」というゲームがあって、プログラムにおけるサイコロの実装が非常にまずくて

「1,3,4,6」の出る確率がそれぞれ1/8、「2,5」の出る確率が2/8になっている

とのこと。
対戦チンチロリン - ゲームカタログ@Wiki ～名作からクソゲーまで～ - atwiki（アットウィキ）
このゲームの場合は残念ながらまごうことなきバグでクソゲーになっちゃったようだが、既存の「同様に確からしい確率」を前提にしていたゲームの中には、確率を変えることでガラリとゲーム性を変えるようなものがあるかもしれないと思う。

確率の話とは少し離れるが、私はゲームで「５０回戦闘したな～」と思ったとき、カウントをみるとだいたい３０回もいってない、という経験がよくある。常に過剰な見積もりをしてしまうこれにも、何か変なバイアスがかかっている気がする。