人間乱数についての覚え書き

人間乱数

人間に「乱数列を書いてください」と頼むとけっこう変な偏りをもった数列を書いちゃうらしくて、人間乱数とか human random number generation とか呼ばれているようである。これがなかなかにおもしろい。
今回は、人間乱数の性質や成り立ち、その利用などについて、ちょこちょこ調べたことをいろいろ紹介してみようと思う。

ブツ切り傾向

いちばんわかりやすい例が「コイントスを100回やったときにできる裏表の列を想像して書いてみてください」というもの。

人間が書いた乱数列は、コインの裏表それぞれの頻度こそだいたい50:50になるものの、「裏が出た次の回に表が出る確率」および「表が出た次の回に裏が出る確率」、つまり「コインの裏表が入れ替わる頻度」が期待値(0.5)に対して異様に高くなるらしい。

ギャンブルに「流れ」はあるか、物語を作る生き物、煮つめられた人生 - 吹風日記

これはギャンブラーの誤謬と呼ばれる現象があらわれたものと見ることができる。ギャンブラーの誤謬とは「表が連続しているから、そろそろ裏が出るはず」というように、実際には独立な事象に対して「確率の揺り戻し」があると考えてしまうバイアスのことだ。このバイアスによって、裏と表の連続が必要以上にぶつ切りにされてしまうわけである。

引用したブログでは、人間は「何回も連続して何かがおこること」の発生確率を実際より少なく見積もるので、単なる乱数列のゲーム結果に対して「流れ」や「ツキ」を見いだしてしまうのではないかと結論している。これは「ホットハンド理論」と呼ばれるものと強く関連したもので、非常に重要な指摘であるように思う。

f:id:xcloche:20180731204013p:plain

手前でも適当にコードを書いて作ってみたが、たしかに上の「正しいコイントス(表裏の入れ替わり確率50%)」よりも下の「入れ替わり過剰なコイントス(表裏の入れ替わり確率65%)」のほうが自然なように感じた。

「期待される頻度」に寄る傾向

人間が書いた乱数コイントスの裏表の頻度はだいたい50:50になる、と書いたが、実はここでも、人間乱数と正しい乱数の齟齬がある。コイントスを100回くらいやると、40%くらいの確率で裏表に10個以上の差がつく(45:55/55:45以上に偏る)のだが、人間乱数ではあまりこういったことは起こらず、50:50に近い出現頻度をとりがちである、という性質があるのだ。

この現象は、コイントスよりもちょっと複雑なタスク、「サイコロの目(1~6)を適当に並べて書いてください」を人間にお願いしたとき顕著に見えるようだ。

http://blog.livedoor.jp/lunarmodule7/archives/4523745.html

引用したページでの

F1: 全体で出た目の回数のχ2値(5.0)

がこれにあたるもので、だいたい「頻度の期待値(1/6)への近さ」を表している。これが理論値に対して人間乱数が半分ほどの値を取っていることからも、人間乱数均等すぎるという性質が見えてくる。

これは小数の法則と呼ばれるバイアスに関連した現象のようである。「小数の法則」は、数学の定理である「大数の法則」をもじったもので、大数の法則が「無限回試行を繰り返せば頻度は期待値に一致する」(意訳)のに対して、「試行回数が少ない場合でも、頻度が期待値に近くないと不自然に感じるバイアス」のことだそうだ。

人間の思う乱数と実際の乱数がズレるそもそもの理由

ここまでで「連続するイベントを切りがち」「出現頻度を過剰に期待値に寄せがち」という二つの人間乱数の特徴を紹介した。じゃあ、なんで人間はそんなに乱数作るの苦手なんだよ、と考えると、どうも(進化の過程で遭遇してきた)現実世界のイベントはたいてい独立事象じゃないからというのが説としてあるようだ。以下の論文を参照した。

Frontiers | The Gambler’s Fallacy: A Basic Inhibitory Process? | Psychology

該当箇所を引用しよう。

The answer may stem from the probabilities associated with particular events and outcomes in both the real world and the casino. In a casino, outcomes are designed to be random whereas in the real world this is usually not the case. For example, when we developed the evolutionary account of IOR using the apple-picking scenario, we postulated that apple pickers inhibit an area of visual space, or perhaps an action associated with a just-picked-apple, in order to turn their attention to new locations and new apples. In fact, the probability of a new apple being in the same location as a just-picked-apple is zero (at least until next year). That is, the probability of event N + 1 is contingent on event N.

(中略)

The cognitive and neural systems that support performance in the real world cannot be expected to contribute to optimal outcomes in an artificial environment where the probabilities of one event are not contingent on previous events (i.e., the casino where outcomes are random).

例として「樹からリンゴを取ったら同じ場所からはリンゴが取れなくなる(N番目の状態とN+1番目の状態が相関している)」というのが挙げられている。
この例の妥当性は措くとして、まあ同じ独立事象が何回も繰り返されるようなことが自然界であるかと言われれば、たしかにあまりなさそうである。リンゴに限らずリソースは「取ると減る」ものなので、ブツ切り傾向と対応している……と言われればそうかもしれない。

最後の部分は「現実世界におけるパフォーマンスを支えるための認知/神経システムが、イベントが独立に発生する人工の環境(たとえば、カジノ)において最適な成果を出すとは期待できない」といったところ。
「イベント発生が独立でない世界(自然界)」で獲得したメソッドを「イベント発生が独立な世界(ギャンブル)」に持ち込んでしまっているから齟齬が生じるのだとすれば、人間の脳はその成り立ちのレベルでギャンブルに向いてないっぽい。

「人間の(一見)不合理に見える性質は、実は進化の過程で何かに適応した結果獲得したものである」をテーマに一冊、一般向けの本が出ていて、"The Rational Animal: How Evolution Made Us Smarter Than We Think" というのがそれ。邦訳が『きみの脳はなぜ「愚かな選択」をしてしまうのか 意思決定の進化論』というタイトルで出ていてパラパラと読んでみたところ、 実験でサルにも損失回避の性質があるなどのちょっとおもしろそうなトピックがのっていた。

人間のもつバイアスと成長

ではこれらの乱数へのバイアスを人間が「生まれたときから持ってる」のかそれとも「成長するうちに獲得する」のかというと、これは一口には言えないようだ。

人間乱数とは少し話題が逸れるが、確率に関するいろいろな問題をGrade 5, 7, 9, 11の学生(小5、中1、中3、高2にだいたい対応)に回答させた研究があって、成長にしたがって減少するバイアスと、成長にしたがって増加するバイアスがあるようだ。

https://www.jstor.org/stable/pdf/749665.pdf

成長して増大するバイアスの中で特に劇的なのが、

Q コインを3枚投げてうち2枚以上が表である確率は、コインを300枚投げてうち200枚以上が表である確率と比べて
① 小さい
②同じ
③大きい

という問題。
正解は「③大きい」なのだが、成長するにしたがって②が増え、③が減るというバイアスの強化がおこっている。子どもの頃は間違えなかった問題を成長するにつれ間違えるようになっていくというのはとても奇妙な印象を受ける。

もうひとつが「Time axis fallacy」と呼ばれるもの(あるいは同型の問題であるモンティホール・ジレンマのほうが通りがいいかもしれない)で、

AさんとBさんが、それぞれ白い石と黒い石が2つずつ入った箱をもらいました。

Q1 Aさんが箱から石をひとつ引くと、白い石でした。石を箱に戻さずに次の石を引いたとき、白い石が出る確率は、黒い石が出る確率よりも
① 小さい
②同じ
③大きい

Q2 Bさんは箱から石をひとつ引いて、色を見ずに脇に置きました。二つ目の石を引くと、白い石でした。一つ目の石が白い石だった確率は、黒い石だった確率よりも
① 小さい
②同じ
③大きい

という問題。

正解は「Q1. ①小さい、Q2. ①小さい」なのだが、成長するにしたがって、Q2のほうで②同じの回答が増えるというバイアスの強化がおこっている。

Q1. については言わずもがなだが、Q2. で「②同じ」と回答してしまうのは「後に引いた石の色が前に引いた石の色に影響を及ぼすはずがない」という考えにミスリードされるから、という説明がなされているようだ。(実際は二つ目の石の色が何だったかという「手がかり」が与えられることで、一つ目の石の色をより正確に予想できるようになる。)

こうした因果関係を過信(?)する傾向が年齢とともに高まって問題を間違えやすくなるのはおもしろい。

人間乱数と成長

人間乱数そのものについても8歳と10歳に0~9の乱数列を書かせてみた研究があるようだ。

An exploration of random generation among children

TPIって指標(相関が強ければ強いほど大きくなる)が8歳から10歳になると大きくなっていて、成長にしたがって「正しい乱数からのズレが拡大している」のがわかる。

「ある数字を書いた後に次にどの数字を書いたか」のグラフが以下のものだ。
f:id:xcloche:20180731204855p:plain
An exploration of random generation among children より引用

グラフは「前の数字との差」を示していて、5の次に6を書いたら1、5の次に0を書いたら-5、ということになる。最も大きな山が立つべき0の部分に、逆に大きな谷があるので「同じ数字の連続」が異様に避けられているのが読み取れる(どうせなら、iからjへの遷移確率の行列をそのまま描いてほしいが……)。
8歳の+1の部分に大きなピークがあるのも要注目で、数を習って間もない8歳児がついつい「4567……」のような連続して1ずつ増えるシークエンスを書いちゃっているということで、ほほえましい。

逆にバイアスにあわせる

上で紹介したブログで、ファイアーエムブレムの確率表示のかなり興味深い工夫が書かれている。

たとえば、ファイアーエムブレムシリーズの封印の剣蒼炎の軌跡新・暗黒竜と光の剣では、攻撃命中率が表示されるにも関わらず実際の命中確率は、表示が50%以上の時には表示よりも高く、表示が50%以下の時には表示よりも低くなるように調整されている。これにより、90%なのにやたら攻撃が外れるとかいうプレイヤーの不満を減じることができる。

これは「ブツ切り」とも「平均化」とも明らかに違ったもので、「90%と言われたとき、90%以上の確率を想像してしまう」ような認知バイアスがあるようだ。

そういえば、ポケットモンスターのゲームは表記通りの確率を用いているが、「ねむりごなは表記75%だけど絶対そんなに当たってない」「ハイドロポンプの80%はウソ」といった「表示されている確率と体感確率が違う」話がよく聞かれる。

f:id:xcloche:20180731212510p:plain

背後には「重要な局面での高命中技の失敗」「ダメ元でやった低命中技での逆転劇」などが印象的で記憶に残りやすい、といったバイアスもありそうではある。

実装した例は知らないが、たとえばゲームにおけるアイテムのドロップ率を「人間乱数にあわせた(自然な印象をうける)ものにする」ことは可能なはずだ。
1%の確率でドロップするアイテムがあるとしよう。直感的には「100回チャンスがあったら出そう」と思いがちだが、100回やって1%のものが出る確率は実は63%程度しかない(期待値は1になるが、これは2回以上ドロップした人によって値が押し上げられているため)。
はじめのほうのドロップ率を1%以下にして、以後は試行回数にしたがってドロップ率が上昇するように設計すると、(2回以上ドロップする確率を押し下げることで)期待値を保ったまま「100回チャンスがあったらだいたい出る」ようなアイテムドロップが実装できるはずである。

かつてソーシャルゲームの有料ガチャの確率操作が問題になっていたが、これは公平性の問題であって、確率カーブをいじいじすること自体が悪なわけではない。
競技むけのゲームでもない限り、コンシューマゲームの「人間向けにチューニングした「快適な」確率」はどんどん工夫をこらしてやっていいと思うし、そういった話をいろいろ聞いてみたい。

※追記
記事を公開して、「ランダムエンカウントのゲームで、戦闘後、一定歩数までエンカウント率を0にするという工夫はこれに当たるのではないか」との指摘をいただいた。これを実装しているという話はけっこう聞くように思う。
敵の出現確率が定数なら「戦闘後すぐに次のバトルがはじまる」ことも当然あり得るのだが、これを人間が「不自然」と感じるのももっともかもしれない(なぜなら現実界での「敵の分布」は一様ではないので)。
ただ、単にすぐ次のバトルがはじまるのは煩わしいのでユーザーエクスペリエンスを損なう、という側面もあるだろうとは思う。

シンボルエンカウントのゲームでは敵は「ある広さのエリアごとに一匹」というふうに配置されることが多く、これが生き物の「縄張り」と対応していると見ると、ある意味「自然な配置」かもしれない。

メダルゲームと標本平均の収束

「人間が自然に感じるように」とも「利益を最大化するように」とも別の方向で確率の動的な操作を行ってきたゲームのジャンルがあって、メダルゲームである。
http://iroirogames.blog.jp/archives/8921473.html

メダルゲームの機械には、週とか日の単位であんまり成績にバラツキが出てほしくないという事情があるそうだ。
ここでいう成績というのはペイアウト(投入するメダルの割合に対する放出するメダルの割合)のことで、これが日によらず一定になってほしい、とのこと。ギャンブルと違って公平性を厳密に守る必要もないので、履歴に応じた確率操作を行ってパフォーマンスを安定させているのである。

ある時間単位で頻度が過度に期待値に近づくわけで、傾向としてはまさに「小数の法則」に対応する。

日単位で収束することを利用して、一日中記録をとって閉店間際に勝てるかどうか予測できる(あるいは、予測して勝った)という話を聞いたことがあるが、ここまでくると眉唾ではある。

バイアスが強化される可能性

ゲーム内で使う人間向け確率なり、メダルゲームの収束機なりによって「チューニングされた確率」に慣れちゃうと、逆にふつうの乱数へ持つ違和感が今以上に増大する可能性はありそうだ。ほどほどにしたほうがいいかも。

どうでもいい話

中にコンピュータと可動おもりをいれて確率のある程度の操作を可能にした、「人間乱数実装サイコロ」ができたらちょっとおもしろいかもしれない。

「対戦チンチロリン」というゲームがあって、プログラムにおけるサイコロの実装が非常にまずくて

「1,3,4,6」の出る確率がそれぞれ1/8、「2,5」の出る確率が2/8になっている

とのこと。
対戦チンチロリン - ゲームカタログ@Wiki ~名作からクソゲーまで~ - アットウィキ
このゲームの場合は残念ながらまごうことなきバグでクソゲーになっちゃったようだが、既存の「同様に確からしい確率」を前提にしていたゲームの中には、確率を変えることでガラリとゲーム性を変えるようなものがあるかもしれないと思う。

確率の話とは少し離れるが、私はゲームで「50回戦闘したな~」と思ったとき、カウントをみるとだいたい30回もいってない、という経験がよくある。常に過剰な見積もりをしてしまうこれにも、何か変なバイアスがかかっている気がする。