想像力と嘘の月:アーカイブされた世界の時代
ギャラクシーのカメラで月を撮影すると現実よりも綺麗に写るらしい。
スペースズーム
以下の記事で、「ぼやかした月の画像をモニターに表示し、ギャラクシーのスマホで撮影すると、ぼやかしたはずなのに鮮明な月が撮影されてしまう」という実験が報告されている。これが Fake-Moon Shotだとして炎上したようである。
「スペースズーム」と名づけられたこの機能は、デジタルズームの一種である。光学ズーム(レンズを動かして撮像素子に写るものを光学的に拡大する)と違って、デジタルズームは基本、単に「画像を部分拡大する」機能である*1。画像を拡大するだけなので、粗くなることはあっても基本的に精細さが向上することはない。
では、なぜギャラクシーのカメラではデジタルズームなのに画像が綺麗になるのかというと、画素の粗い画像をきれいにする超解像(Super-Resolution)技術が用いられているからである。超解像には「粗くした画像を元画像に復元する」学習をした機械学習モデルが用いられる。部分拡大して粗くなった画像を入力すれば、本来存在しないはずの「きれいな元画像」が推論され、出力される。入力が粗い月の画像ならきれいな月が「復元」されるというわけだ*2。
ここで注意したいのは、粗い画像は精細な画像と比べて、情報が失われているということだ。「ぬ」か「め」かがつぶれて判別できない看板の画像や、つぶれてしまった鳥の目や羽毛の彩色パターンを超解像で復元するのは、世界を撮影した大量の写真データをもとに、失われた情報を無理やり想像で補完して「一番ありえそうな元画像」に仕立て上げる操作である。ゆえに、被写体に存在していた「ぬ」と「め」の誤植を前後の文脈から「修正」しうるし、モデルによっては被写体とは異なる新種の鳥を「復元」しうる。近頃、これによる存在しない鳥がインターネットにあらわれて鳥クラスタで騒ぎになっていたようだ。
実際に〇日間無料プランに入って試して見たら、スマスコカナダカモメがこうなった pic.twitter.com/E9CgqlqHxF
— ねねこ (@noahsun_bird) 2023年5月2日
スペースズームはこれまでの人類が撮影してきた月の画像に基づき、どうやら月らしいと認識した物体をより月らしく「復元」する。
では、月に新たに隕石が衝突して、クレーターがひとつ増えたらどうなるだろうか? 超解像モデルの学習後に表面の模様が変わってしまった場合、その情報で更新されていない超解像モデルは、「衝突前の月」を復元してしまうはずである。目の前の月を撮っているつもりで、そこに写っているのは人類がこれまでに撮ってきたアーカイブ上の月である。
デジタルネイチャー
現代の魔法使い(?)こと落合陽一が提唱する概念に「計算機自然/デジタルネイチャー」がある。氏の研究室の説明によれば
コンピュータと非コンピュータリソースが親和することで再構築される新たな自然環境であり,人・モノ・自然・計算機・データが接続され脱構築された新しい自然
とのことである。要はコンピュータ上の物理シミュレーションと現実が容易に相互作用する世界観のようである。
氏はいわゆる機械学習そのものの研究者ではなく、それを活用するメディアアーティスト・実務家的な立ち位置の人物*3印象がある。計算機自然/デジタルネイチャーについても、コンセプトとしては提示しているものの具体的に何がどう対応するかまでは落とし込まれていない、ふんわりしたものだったように思う。そんな氏が、計算機自然の具体的実践の足がかりとして初めて、最近arxivで公開したのがこの論文*4である。
論文の内容は「抽象言語オブジェクト」という中間言語を用いることで自然言語(われわれの日常言語)と計算機言語(プログラミング言語)を橋渡しする、という内容である。
デジタルネイチャーの観点からいえば、「自然-自然を説明する言語-抽象言語オブジェクト-計算機言語-計算機シミュレーション」で接続されるといったところだろうか?
抽象言語オブジェクト
たとえば抽象言語オブジェクト「猫」は次のような量を潜在的にもつよう定義される:
mainObject: 猫 - subObject: 見た目 - knowledge(色) - knowledge(目の色) - knowledge(毛足の長さ) - ... - subObject: 行動 - ... - subObject: 血統 - ...
つまり、オブジェクト・猫は「見た目」という属性を持ち、その見た目は「色、目の色、毛足の長さ」などの情報をもつ。他に行動や血統、健康状態などの他の属性があり、これらに現在の具体的な値(黒猫で、瞳は金、毛足は短く、こちらを威嚇している。右目を怪我している)などが代入される。ここで、これらのオブジェクトは逐次的に条件を追加することでLLM上でそういうものとして定義・記憶されるものであって、しっかりとしたプログラムのクラスのようなものではないようである。
これが氏の提唱する、現実世界の猫の映し絵たる Abstruct Language Objects, ALOs/抽象言語オブジェクトである。
では、ALOsをどう使うのか。オブジェクト・猫*5のようなオブジェクトを複数用意してみよう。3D世界、ルンバ、猫という三つのオブジェクトを定義する。3D世界は広さという値をもつだろうし、3D世界内に配置されたオブジェクトとして猫やルンバを定義すれば、かれらは位置という情報をもつだろう。まずはALOsという形でオブジェクトが自然に相互作用しやすいように、ただ状態を列挙したものとして言語的に説明可能な世界を構築する。
中間言語的なオブジェクトは階層的かつ(ある程度)網羅的に属性や可能なアクションが定義されている。これらを3D空間上でのCGシミュレーション*6で彼らを動かす関数に変換してください、とGPT-4にお願いすれば、javascriptのオブジェクトになったALOsが言語的に自然に相互作用するわけである。論文中では言語的にALOsでかれらを定義しただけで、猫がルンバの上に乗ったりじゃれついたりしたケースが述べられている*7。ALO上の属性情報を展開して画像生成AIに入力することで、言語シミュレーションを画像化できる、という事例も挙げられている。
なぜこのようなことができるのか。
これらのオブジェクトが持ちうる多様な属性は、言語モデルに「ブレスト」させて沢山列挙させて作られ、他のオブジェクトとうまく相互作用するように、言語モデルによって修正を受けたものである。
LLMに適当に定義させたオブジェクトが自然に相互作用できるのは、言い方を変えれば、人間の想像力の範囲内で動いているからである。言語モデルは人類が作った膨大なテキスト群から「次にどの単語が来るのが一番自然か」を予測するモデルであり、最もいかにもありそうな続きを紡ぐ装置である。平均的な人間の想像ではなさそうなこと━━猫の右手がロボット義手になっていてルンバをロボットパンチしたり、ルンバが巣を作って卵を産むようなことは起こらない。
ALOsによる言語シミュレーションは嘘の月である。月に起こった新しいイベントをギャラクシーのカメラが捉えきれないのと同じように、ALOsの言語シミュレーションは自然界で未発見の現象を記述することはなく、「今までの人間が考えてきた・そうなるだろう世界」以上のものにはなり得ない*8*9。
言語モデルを用いて中間言語を生成し、自然っぽい挙動をさせる、というアイデアは単純ではあるが一定の面白さがあるように思う。が、自然科学的な意味では、この新規性のない自然を「自然」と呼ぶには強い抵抗がある*10。
しかし、より生活に根差した工学的な意味、生活する上での有用性としては、嘘の月と同様に評価すべきポイントがある、とも言えると思う。
嘘の月は本当にきれいです!
嘘の月はなぜ燃えたのか?
「写真は真実を写すべきである」信念の人が怒ったからだろう。しかし、これだけスマホの写真フィルター・加工アプリが流行っているいま、被写体と写真が似ていることにどれくらい意味があるだろう? きれいな月の写真の方がいっぱいいいねがつくのではないか? ちゃんとした記録写真はでかい天文台で仕事をしているオタクの天文学者に任せればいいのではないか?
同様に、たとえばVRで自然を再現したいのであれば、一般的な人間が想像しうる程度に真似できていれば十分ではないか? 言語シミュレーション由来のルンバと猫が踊っていればエンターテイメントとして100点で、デジタルネイチャーで新たな自然現象が発見される必要はない*11。
━━というような考え方も可能である。記録写真と思い出写真、実際の世界と人間が想像する世界は違い、どちらを求められるかは時代と場所によりけりだろう。
これからの日常の世界はだんだんと後者のような、どこかにアーカイブされた・想像通りの・美しく変わることのない見た目の世界になっていくような気がする。
残念ながら、本物よりも嘘の月の方がきれいなので。
*1:厳密には視野に応じてフォーカスや露光が調整されるが、だいたいこの理解でよい
*2:Galaxy の「スペースズーム」は「偽造」なのか? - Deep Sky Memories このような反論もあるが、月を物体認識しているし、まあ普通にSuper-Resolutionしてそう……と思った。が、公式も声明を出しているし、実装の真相は不明である。
*3:彼の論文は主に光や音、物体によるインターフェースの研究であり、メディアでよく言及されている技術的特異点や機械学習とは異なる
*5:猫の可能な動きについては、上位のALOsであるmanagerObj(cat)が管理するようである
*6:Three.js
*7:他、教室において授業が行われる言語シミュレーション、スマートフォンとwi-fiとprinterが相互作用する言語シミュレーションが挙げられている。wi-fiのモデルであるprompt 6 は prompt 4 をコピペミスしているっぽく、prompt上に謎のteacherやclassroomが登場している
*8:discussionにおいて、ALOsのこの問題(世界と言語シミュレーションのズレ)は単にドメイン知識の問題として認識されている。が、LLMを使う以上人間の想像力による強いバイアスがかかっていることは重視すべきだと思う。
*9:この考え方はALO=事態とみれば、人間が言語化できないものに対する取り扱いまで含めて、前期ウィトゲンシュタインの言語論的な世界観に近しいと思う。落合氏はnoteでALOsこそ仏教における阿頼耶識である、という謎の主張をしており、これについては本当に何を言っているのか意味不明である
*10:逆に、言語シミュレーションと世界の差異から現状の言語化が取りこぼしたものを検出し、新しく名づける操作は面白いかもしれない
*11:もちろん、人間が想像可能なことの中に、まだ人間が想像していないことは存在するはずで、そういう意味での新規性は否定されない。
うそはうそであると見抜ける人でないと(AI生成を使うのは)難しい
ChatGPTはすごいが、人間は……
大規模言語モデル(LLM)が盛り上がっている。
対話型のテキスト生成・ChatGPTやGPT-4ではすごいことができるんだぞ〜、というトピックで、ちょっとバズっていたツイートを2つ紹介する。
ツイート1:「京大の入試問題が解けた」という内容。GPT-4すごい....京大の伝説の素数問題を各モデルに解かせてみたらすごい違う。
— いつーーーーーーーーーきーーで (@K1_YouTube) 2023年3月14日
最初のモデルは問題放棄。
次のモデルは場合わけはしてるけど冗長。
そしてGPT-4は偶数・奇数で場合分けしてるし簡潔で分かりやすい。#gpt4 #GPT4 #chatgpt pic.twitter.com/MtBzs17GsQ
ツイート2:「入力テキストを絵文字や記号で圧縮し、意味を損なわずにトークン長を短くできた」という内容。ChatGPTでトークン数圧縮の手法を使ってみたけど、確かに全力肯定彼氏くんみたいな、いかにユーザーとの体験を記憶できるか(いかに少ないトークン数の中に多くの情報を詰め込めるか)みたいなサービスを作る場合はすごい威力を発揮できるし追求のしがいがあるわ...
— 朱雀 (@Developer65537) 2023年4月9日
↓トークン数を6分の1にできた例 pic.twitter.com/vRyfswsz86
これらのツイートには、リプライや引用リツイートで「仕事がなくなるかも!」や「AIによる圧縮言語ができている!」など、LLMの驚きの性能に共感する反応が寄せられている。たしかに、ここ数ヶ月のLLMの発達はめざましく、GPT-4は各種の難関試験に挑戦し、日本の医師国家試験にも合格できることが証明されている。数学の試験問題を解くことも、意味を損なわずに文を圧縮することも可能だろう。
しかし、ここで一旦立ち止まり、上記のツイートの出力をよく読んでみよう。実際には、数学の問題は解けていないし、「圧縮」して「復号」した文は意味を成していないのである(次節で詳細を述べる)。
この記事の主題は、「LLMは無能であり、人間の知的能力はすごい」ではない。ぼくはLLMがこれらの課題を解くことは十分に可能だと思うし、かりに今うまくいかなかったとしても1年後にはできるようになると考えている。
この記事では以下の2点について書く。
「テキストを読むのは難しい」という人間の課題が浮き彫りになってきたこと。
AI創作時代に必要なのは、指針を定め、指針通りか判断するための生成物を見る能力であること。
テキストを読む
「LLMの驚きの性能」を概観しよう。まずはひとつ目のツイート。
試験問題を解かせてみた、という趣旨の投稿である。問題を見れば、受験数学の「〜な素数をすべて求めよ」で答えが無限個あると問題が成立しないので、「〜な素数はrとsです。ほかは全てaかbの倍数になります」のフォーマットを見つけて立証すればよい、という指針がたつ。
序盤、GPT-4はp, qを偶奇で分けて、片方が2でもう片方が奇素数の場合だけ考えればよい(それ以外のケースは2より大きな偶数になるため)ことを立証している。かしこい。p=2, q=3のときは17で素数になった。問題はこの後である。
q=3の場合はすでに確認しました。
q=5の場合、pq+qp=25+52 = 32 + 25 = 57
この場合、 結果は57であり素数ではありません。
q=7の場合、pq+qp=27 +72 = 128 +49 = 177
この場合、 結果は177 であり素数ではありません。
これ以上のqに対しても、pq + qpが素数になることはありません。そのため、pq + qp で表される素数は 17 のみです。
2サンプルが素数ではなかったことを受け、「これ以上のqに対しても、pq + qpが素数になることはありません」と唐突で根拠のない主張が行われ、回答が終了する。この設問の本体はここであり(5以上の3の倍数でない奇数を入れると3の倍数になることを証明すること)、このような根拠のない主張は意味不明で不誠実だ。採点基準的にはこの回答には30点中10点くらいのお情け部分点が付与される。
お情け部分点回答を見てGPT-4はこの問題が解けている!と驚くのはアホである。
二つ目のツイートでは、量子コンピュータの最新事情に関するテキストを記号を使ってできるだけ圧縮し、復号している。圧縮の結果が上の画像。
の部分などは「D-Waveはアニーリングで高温状態から温度を下げることで解を探す」みたいなことを言っているのかな……というのが感じられて少し面白い。
意味を(ある程度)保ったままtoken長が1/6にできたとのことだが、はたして復号文ではどれくらいもとの内容が維持できているだろうか?
(入力)
量子コンピュータは問題を解く方法の違いにより、量子ゲート方式と量子アニーリング方式の大きく2つに分類されます。
量子ゲート方式は、量子状態にある素子の振る舞いや組み合わせで計算回路を作り、問題を解いていきます。 超電導やイオントラップ、トポロジカルなど様々な実現手法が提案されています。従来型のコンピュータの上位互換として期待が高く、 グーグルやIBMなどの大手ITベンダー、 またリゲッティ・コンピューティングやlonQなどのスタートアップがハードウェアの開発を進めています。
量子アニーリング方式は、 組み合わせ最適化問題を解くことくに特化しています。高温にした金属をゆっくり冷やすと構造が安定する 「焼きなまし」の手法を応用して問題の解を求めていきます。 商用化で先行するD-Wave Systemsのハードウェア(以下、D-Wave マシン)では、格子状に並べられた素子に相互作用を設定し、 横磁場という信号をかけて、素子全体のエネルギーが最も低くなる状態を探し出していきます。 日本ではNECが2023年までの実用化を発表しています。
(復号)
量子コンピューティングは、アルゴリズム (計算の手順) と量子アルゴリズムの二つの側面があります。 量子ビットは、量子回路を通じて量子状態、量子相互作用、および測定 を行います。主要な企業 (Google、 IBM、 Microsoft) が量子コンピュータの開発を加速しています。アルゴリズムは、問題を解決するための鍵となる計算手法です。 燃料の最適化や低温物理学(D-Wave) などの分野で応用が期待されており、効率的な量子アルゴリズムが開発されています。日本のNECは、2023年に量子コンピュータの商用化を目指していま す。
内容を見比べてみると、一行目から「量子コンピュータにはゲート方式とアニーリング方式がある」が「アルゴリズム(計算の手順)と量子アルゴリズムの二つの側面がある」というまったく意味不明な記述に変わり、スタートアップの情報が消え、「🔥-❄️」に圧縮されたとおぼしき「焼きなまし法」は復号時にまったく意味が異なる「燃料の最適化や低温物理学」に変換され、続くアニーリングの説明も消えているように見える。最後のNECによる商用化の話だけはかろうじて意味を保っているが、全体的にはほぼすべて間違いと言ってもよい文である。セルフリプライには落ちている情報もあるとの留保が述べられているが、ここまで変わってしまうと使い物にならない。
このテキストを見てChatGPTは高いレベルの抽象化要約力がある!と驚くのはアホである。
テキストは読めない
「東大に合格できる人工知能を作る」ことを目標に進められていた人工知能プロジェクト「東ロボくん」を覚えているだろうか?
東ロボくんは試験問題を解くことに特化したプロジェクトである。プロジェクト中心メンバーの新井素子氏の著書『AI VS. 教科書が読めない子どもたち』によると、ベースには自然言語処理の係り受け解析があり、世界史ではオントロジー*1つきデータセットを用いた正誤スコア関数の学習、数学は自然言語処理で問題文を数式処理に落とし込んで回答する*2……といった具合で、タスクに応じていろいろな工夫をしていたようである。
大規模言語モデルがTransformer(抽象化した係り受け解析みたいなもん)とWebのテキストをやたらめったら大量に詰め込んで作られている今から見ると、ここ10年の自然言語処理の変化に隔世の感がある。
世代の違う東ロボくんとLLMでは異なる戦略が取られているのも興味深いが、ここで取り上げたいのは、東ロボくんが文意をまるで取れてなかったにもかかわらずある程度「成績がよかった」ことから、新井教授が「AIが問題文の意味を理解していないにもかかわらず、どうして8割もの高校生がAIに敗れてしまったのか」という問題意識を持ち、
正直言って、東ロボくん(AI)の性能を上げるよりも中高生の読解力を向上させるほうが国民としては直近の課題だ
として、研究者としてのキャリアをAI研究から教育へ大きく舵を切ったことである。
氏は「事実について書かれた短文を正確に読むスキル」を測るリーディングスキルテスト(RST)を開発し、「中高生はどれくらいテキストを読めているか・どういう要素があると読めないか」を調査した。有名な例が
仏教は東南アジア、東アジアに、キリスト教はヨーロッパ、南北アメリカ、オセアニアに、イスラム教は北アフリカ、西アジア、中央アジア、東南アジアにおもに広がっている」
という文を読んで
オセアニアに広がっているのは( )である
のカッコ内を埋められるか、という問題である。この問題は、直前に答えが書いてあるにもかかわらず、中高生の6-7割しか正解できなかったということでセンセーショナルに報じられた。興味深いことに、こうした基礎読解力は読書習慣とも学習習慣とも相関していない(貧困とは相関している)そうである。
『AI VS. 教科書が読めない子どもたち』は「最近の若者は〜」的な論調が目につき、こうした読解力の不足を子どもや現代の学校教育の問題として捉えているきらいがあった。しかし、調査対象にしていないだけで、大人にも同じ問題があるのではないだろうか?(RSTは大人は教育者や編集者、官僚など、インテリしか調査対象になっていない雰囲気だった) もちろん教育によって改善する可能性もあるが、教育の問題というより「一般に想定されるライン以上に、人はテキストを読めないし、読まない」のではないか?
成人のテキスト解釈能力の調査としては、国際成人力調査(PIAAC)があり、各国の成人の読解力、数的思考力、状況の変化に応じた問題解決能力を測定している。
上記の記事では「役所の書類なんてまともに読める人のほうが珍しい」という話が述べられている*3。記事全体の趣旨としては「知識階級によって作られている社会は、(無意識のうちに)ひとびとの知能を高く見積もっており、それによって排除されている人々がいる」という話である。
役所や病院の「住民票の写し」とか「処方せん」みたいな、管理側の理屈でつけられた直感的ではない意味不明なワーディングはやめたほうがよい! テキストは想像以上に読まれないという前提でインフラは実装されなくてはならない。
「読むこと」が「書くこと」になる時代
AIと「読む/見ること」についての話に戻る。
ChatGPTなどのLLMは、体裁はどこかそれっぽく見えるもっともらしい嘘をつくことが知られており、この現象はハルシネーション(幻覚)と呼ばれる。はっきりとした原因は不明で、(嘘を垂れ流したくないのであれば)現状は出力にそういった嘘が含まれるものと思ってチェックする、という工程が人間に求められる。
上の例を当てはめてみれば、「問題が解ける(書ける)必要はないが、解答が正しいかどうか確認する(読む/読める)必要はある」「要約を書く必要はないが、要約になっているか確認する必要はある」という話になるだろう。
現在のLLMは、「読めるけど書けない」を「読めるなら書ける」に変えるツールである。
たとえば、今は「プログラムのコードを読める人」の中に「コードを書ける人」がいて、その間に「読んだらコードの意味はわかるけど書けはしない人」がいる。現代のレベルの生成AIは、こうした「読めるけど書けない人」を補助する技術なのである。嘘をついたり間違える可能性がまだまだあるので、それをチェックする機構がないと言論の場で用いたり製品に使うのはダメでしょう、というわけだ*4。
テキストに限らず、画像生成におけるデザインや構図も同様だろう*5。「絵を描けないけれども想像できる」人を「想像できるなら描ける」に変えるのがツールとしての理想の画像生成AIであり、最近ではControlNet等の登場によって、指定通りの構図での生成が可能になって「想像を形にするツール」にまた一歩近づいている。
ぼくは生成AIを、「読むこと」を「書くこと」に、「想像できること」を「描くこと」にするように、「人間が(技能の問題で)形にできないもの」を手助けしてくれるツール、人間の出力の可能性を拡張するツールとして捉えている。何を生成させるかを決めることも、AIの提案にしたがって掘り進めていくことも、過程で偶発的にできた生成物から自分が思う「よい」方向を定め直すこともすべて、読み、想像することである。生成物を見ろ。生成テキストを読め。
*1:数理的に扱いやすいように、単語にメタ情報のアノテーションをつけること
*2:専門に近いようだが、ちゃんと数学をロジックで解いていたらしいのには驚かされる
*3:この記事は「日本人の6人に1人は偏差値40以下」というタイトルで「6人に1人が偏差値40以下なのは偏差値の定義(正規分布)から自明じゃん」と小馬鹿にする流れでよく言及されていた。ミスリーディングなタイトルではあるが、記事を読むと正規分布を前提にした上で「知識社会において、偏差値60以上の人と同じだけ偏差値40以下の人がいることは無視され、包摂されていない」というまっとうな文脈であり、小馬鹿にしてシェアすることが読解力のなさの露呈になる悲しいトラップになっている
*4:今後は「読めないけど動くものを作りたい」というニーズによって、意味もわからずその目的を果たすためのコードを生成する、という使い方をする人が増えるように思う。先述の通り、読めなくても使ってよい段階になるにはもう一段階のブレークスルーが必要そうである。
この考え方と関連して興味深いのが、最近LLMの拡張として注目を集めている手法、Godmode(AutoGPT)で、AutoGPTは、ChatGPTのようにそのまま返答を出力するのではなく、与えられたタスクを小さなタスクに分割し、使用者にひとつひとつ「タスクを実行するために小タスクに分割しました。この小タスクを実行するということでいいですか」を確認する、という流れをとる。単純にタスクを分析的にわけて扱うことで精度があがることに加え、どこで齟齬が発生したかを特定して修正できるので制御性も高いわけだが、読まずに全部承認することも可能であり、結局人間はテキストを読まない!
「大解体時代」を振り返る
このテキストは、私が反-重力連盟のSF短編アンソロジー『圏外通信2022』に書いた「「大解体時代」を振り返る」を加筆・修正したものです。
でかい塔の解体によって駆動する文明の歴史
解体前史
〈塔〉の頂上は天に届いているともいわれた。その高さは杳として知れないが、一周するのに馬で一刻はかかり、上に向かうにつれ少しずつひねりが加わる長大なねじれ六角柱の形状をしていたという。遠くの山脈から見る〈塔〉は、らせんを描きながら雲をつきぬけ、やがて上の方が霞がかって見えなくなったはずである。本当は六角柱ではなくて徐々に先細っている六角錐なのかもしれなかったが、当時は誰もその全容を知らなかった。
逆に、〈塔〉は上にいくほど太くなっていると唱える者もいたという。頂上はなく、漏斗のように広がって、空そのものになっているというのである。そうであっても不思議ではないほどに、手付かずの〈塔〉には宇宙のはじめからそこにあるかのような威容があった。
遠くから見た〈塔〉は、(影の側でないなら)少し光沢のある深い緑色をしていて、ところどころに窓のような穴があいていたはずである。近づいてみると、人の背丈の半分ほどの大きさの立方体の煉瓦を組み上げて建てられているのがわかっただろう。煉瓦は幾重にも幾重にも配されていて、いくらか抜けてその奥にある煉瓦が見えるのだった。
〈塔〉を作った先人たちがいるという言い伝えがあった。または、〈塔〉は宇宙と同時に作られたともいわれていた。曰く、〈塔〉が完成させた先人たちはどこかへ去ってしまった。曰く、〈塔〉は空と大地の連絡通路として作られた。曰く、〈塔〉から落ちた煉瓦が大地となった。曰く、〈図書館〉も〈塔〉と同時に作られた。曰く、〈塔〉には無尽蔵の油がある。曰く、〈塔〉ができる前はことばはひとつだった。曰く、〈塔〉に入って帰ってこなかった者がいる。曰く、〈塔〉の近くにはうまいブドウの園がある。曰く、昼でも〈塔〉の影になっている暗闇のぬかるみには、目のないおそろしいカエルが住んでいる――
いずれにせよ、この時代、〈塔〉のまわりに住んでいる人はいなかった。畏怖の念から、あるいはその巨大な影によっておおきな暗闇ができ作物ができず獣が寄り付かないという即物的な理由によって、〈塔〉は人々から敬遠されていた。あまりに人が寄り付かないので〈塔〉の周囲にはひどいぬかるみの沼や密林が生い茂り、たまに現れる酔狂者のゆく道を阻んでいた。
灰の時代がくるまで、〈塔〉はただそこに立っているだけだった。
灰の時代
灰の時代になり、森が枯れ、大地から油がとれなくなると、しだいに〈塔〉のまわりに集まる人々があらわれはじめた。世界のどこからでも見える、先人たちの偉業の賜物、不可思議な煉瓦を天まで積み上げた偉大な〈塔〉、無尽蔵の油の言い伝えは、終末を予見した人々が身を寄せるのに格好の道しるべだったようである。
はじめに来たのは狩猟を生業とする者たちだった。元来定住をせず、一族で用いる大きな天幕を携えてあちこちを渉猟していた彼らが、狩場に獲物がいなくなったのをきっかけにこれまで禁足地としていた密林に踏み込むのにさほど時間はかからなかった。狩猟者たちが拓いた道を通って開拓がすすみ、灰の時代の脱出口として、さまざまな人々が〈塔〉の周辺へ流入しはじめた。
解体時代の幕開け
解体時代がはじまる前にも、何らかの理由で〈塔〉から剥落したものか、〈塔〉と同じ素材の煉瓦が地上で見つかることがあり、耐火性・断熱性にすぐれた建材として用いられていたようである。
そういうわけで、〈塔〉の解体は、建材として引き剥がした煉瓦を利用することからはじまった。
地表付近の煉瓦は近くに住み着きだした人々に次々と建材として取り外され、〈塔〉は成形された煉瓦がとれる便利な石切場として活用された。
巨大な〈塔〉を支える煉瓦を取り外せるというのは一見奇妙であるが、これには〈塔〉の特殊な構造が関係している。〈塔〉の容積の大部分である煉瓦は構造材ではなく(ではなくに傍点)、積載物だったのである。〈塔〉自体を支えているのは中央にある第一から第六までの基柱(当時は未発見)と、基柱から煉瓦四つ分の高さ毎に伸びる梁・床からなる階層構造であり、載せられているだけの煉瓦はそれぞれの層においての上から順であれば容易に押し出すことができた。
まずは最下部の表面付近から煉瓦が持ち去られ、遠目で見ると一番下が先細っている不安定そうな見た目になった。煉瓦を建材に利用して〈塔〉の昼の側(影が差さない側)にいくつか集落ができ、灰を耐えて〈塔〉をめざしてやってくる人口の増加を支えていた。
落下熱の発見
有名なわらべ歌にもあるように、歴史上において落下熱の発見はおそらく偶然だったようである。
歌には細かい部分の情報に抜けがあるが、原話はこのような話である:
まだ煉瓦が建材としてしか用いられていなかったころ、〈塔〉の上がどこまで続いているのか調べるため、大量の干し肉と水、寝袋を担いで登攀をはじめた男がいた。男は時おり〈塔〉の窓(煉瓦の抜けのこと)で休みながら登り続けていたが、夜眠る段になると煉瓦ひとつ分の穴ではせまくてやりきれない。気持ちよく過ごせる空間を作ろうと、休んでいた窓から隣の煉瓦を落としたところ(注※当時はまだ法の規制がなかった)、落ちた先の地上の沼では落下の衝撃で轟音が鳴り響いた。たまたま近くにいた狩人たちが何事かと見に行くと、沼に落ちた煉瓦からシューシューと湯気が上がっている。煉瓦の周囲には茹で上がったカエルが三匹浮いていた。その後、沼の近くには旅籠ができ、熱いカエル鍋を出す店として繁盛した。
発見の経緯が本当にこのようなものだったかは今となってはわからないが、貴重な油のかわりに煉瓦の落下熱を使う手法はこの後急速に広まり、調理や冬の暖をとるために盛んに用いられるようになった。
最下層付近の煉瓦を建材としてだけ使っていた頃とは異なり、熱源としてある程度の上層から煉瓦を落とす利用がはじまると、①上層での押し手の恒常的な滞在と②安全のための落下管理の必要が生じてきた。
①上層での押し手の恒常的な滞在については、当初こそ食料を担いで登攀した若者が代わる代わるに勤めていたが、登攀ルートが整備されたとはいえ、昇り降りの効率の悪さが問題になっていた。より温度の高い熱源にするために高さが増していったなどの事情も工率の悪化に拍車をかけた。
②の安全性のための落下管理 については、最初期は定刻になると投げ落とす手法がとられていたという。だいたいの集落では、〈塔〉の上にいる者が日時計をもとに昼・夕の二度、季節に応じて決まった数を落としたそうである。その時間は集落の者は落下予測地点には寄り付かず、落下の轟音が聞こえてから取りにいくといった具合で、時報としても活用されていたようである。
落下熱の需要が高まるにつれ、〈塔〉の上下での連絡や物資、人の移動を簡便にすることが重視されるようになっていく。
これらの問題解決を大きく前進させたのが、昇降滑車の発明であった。
昇降滑車の発明と社会階層
異様に長いロープと滑車の組み合わせて作られた昇降滑車は、上層と下層の関係に大きな変化をもたらした。
昇降滑車は、下層からは食物や衣服・金銭を、上層からほぼ同量の煉瓦やゴミ、排泄物などをおろす、という形で運用され、上層に住む者は下層から送られてきたものを対価に、相当分の煉瓦を投げ落とす生活を送るようになった。
昇降滑車のうち大きなものでは人員の輸送も原理的には可能だったが、歴史的にはあまり使用されることはなく、〈塔〉の上の者はある種の特権階級として遇されることを望み、一生を通して一度も地上に降りず過ごす者が多かったという。彼らは後に塔上人と呼ばれる支配階級を構成し、しだいに地上に降りることを極度に忌避さえするようになるが、これは普段高速で落ちていく煉瓦を見ているうちに、落とす側から落とされる側になることを強く恐れるようになるためだった。
大規模な集落になると、より高い層へアクセスするために昇降滑車の中継を行うこともあった。中継階は地上の例にならって駅と呼ばれ、一般的には十階層ごとに設けられていたという。
また、この時代、最下層の駅である十階層において、〈塔〉の内側の煉瓦を落として内部を探索する試みが行われている。〈塔〉が六つの基柱で支えられていたのが明らかになったのもこの時期である。
また、六本の基柱の中央には巨大な中空の空間があるのが発見され、大空洞と名付けられた。この頃の〈塔〉では内側に入りこむほど上層の大量の煉瓦に遮られてまったくの暗闇の空間になっていたので、塔上人たちも基本的に〈塔〉の外縁部で生活していた。
〈図書館〉の合流
落下熱が熱源として盛んに利用されはじめた当時、大地に生きる人の約半数が〈塔〉の周りで生活していたといわれるが、この頃になってようやく〈塔〉周辺に移住してきたのが、それまで〈図書館〉に引きこもっていた学者たちだった。〈図書館〉もまた、〈塔〉と同じく栄華をきわめた頃の先人たちが築いた偉業の建築であったといわれている。
灰の時代は、膨大な本を収蔵していた〈図書館〉にもひとしく訪れた。学者たちはしばらくはそのままこもっていたが、やがて火を灯す油がなくなると、まず絨毯を燃やし、閲覧台を燃やし、とうとう本を取り出した書架までをも薪にしたという。すべての書架を燃やしてしまうと、かれらはそれぞれの(かつて入っていた書架の)担当の本を読んで記憶し、覚えた端から火にくべた。
今日でも学者が通常の名前ではなく番号の羅列の名前を持つのは、このとき彼らがかつての名前を捨て、担当していた書架の番号を名乗るようになったためである。この名付けは、誰に尋ねればいいかを明らかにする索引番号であると同時に、書を燃やした罪の烙印であった。
〈図書館〉で燃やすものがなくなった学者たちが〈塔〉へ大移動して来たころには、〈塔〉の周囲の社会階層はかなり固定化しており、よそ者であるかれらはまずは労働力として、〈塔〉下部でおろした煉瓦を輸送する労務にこき使われた。大移動の前後は特に灰が厳しく、この時期に多くの書架番号に欠番が生まれた。これ以降、学者は生涯のうちに必ず数人の弟子をとり、口承で覚えているかぎりの本の内容と書架番号とを引き継ぐようになったとされる。
大解体初期:動力革命
〈図書館〉の合流によって〈塔〉にもたらされた最も大きな変化が、動力革命である。
回転運動の動力を作業の自動化に用いたり前後運動に変換する発想は、もともと灰の時代以前の哲学者が戯れに考案して書に記したものだったが、滑車による積みおろしという、降ろせる煉瓦があるかぎり恒久的に回転させられる動力源の発見をもって見事に花開き、大解体時代が幕を開けた。
滑車の回転力は下階層に伝達され、衣服の製造や食料品の加工、金属の精錬・加工など工場の動力として用いられた。塔上人は動力の提供者として栄華を極めた。この頃になると彼ら自身が働くことはなく、滑車で送られてくる税を受け取り、下層の住民を雇って煉瓦を滑車に誘導しておろし続ける労働に従事させた。
増える動力需要に応えるため、煉瓦を落とす動力を使って新しい煉瓦を落とすよう自動化の発明なども進み、そうした発明家の中には、莫大に得た富で貴族階級を購い、新たに塔上人になる者もいた。
軸のついた容器に円盤をいれて回転させることで動力を〈塔〉と分離して持ち運べるようにした慣性円盤体(通称:ゼンマイ)が発明されたのもこの時期である。ゼンマイで回転が持ち運べるようになったことで、自動車や登攀機などの独立機械が次々と登場した。ゼンマイの発明以降、煉瓦を滑車で降ろす数は年ごとに倍々で増え、記録ではピーク時には毎秒六万個の煉瓦がおろされていたという。
動力/熱源とするために下ろした煉瓦は、かつては建材として用いたり遠くへ運んで投棄されていたが、より簡易的な解決方法として、一旦集積所に積み上げ、年に一度の頻度で都市全体の地面を高くする〈地上げ〉で処理されるようになった。これによって、〈塔〉を中心に擁したなだらかな山が歴史を積み上げながら成長を続けることとなった。
大解体中期:言語と社会階層の変化
大解体中期は、〈塔〉は油なしで熱と動力が得られる唯一の都市として人口の流入が続き、大地に住む人のほぼ全てが〈塔〉の周辺で生活を送るようになった時代である。〈塔〉周辺への人口の集中と過密により、問題となったのが言語と文化の衝突であった。
それまでの大きな都市は〈塔〉の外周沿いに作られ、移住前に住んでいた出身地方ごとにいくらか棲み分けがなされていたが、低・中層の解体が進んだ大解体中期には、外の煉瓦が取り払われて大空洞に外光が入るようになり、〈塔〉内部への都市の建設ラッシュがはじまった。〈塔〉で光を遮られていた夜側にはじめて街が建設されたのもこの頃である。
これらの新興の都市に外周の都市からさまざまな言語の人が移住した結果、第二基柱周辺の都市で用いられていた言葉を基本として、後の統一語となる混合言語が発達した。やがて大空洞で発達した言語・文化・金融が〈塔〉経済圏の中心を担うようになり、この時期を境に、塔上人は徐々に力を失っていく。
〈塔〉の解体が進むと同時に、ゆるやかに社会階層の変化と言語の融合が進行していたのである。
大解体後期:現在
現代では、およそほとんどの積載煉瓦をおろし終わり、頂上から順に〈塔〉の構造体自体を崩して動力へ変換しはじめた百二十年前以降の時期を「大解体後期」に位置付けようとする向きが主流になってきている。
予測では十数世代の猶予はあるものの、〈塔〉を解体しきってしまうと、生存に必要なだけの動力を得る方法が失われてしまうので、第三基柱付近で新たな動力源を探す研究開発が盛んに行われている。二十年前、煉瓦は有機元素と金属からなる化合物で、自然界では非常に安定だが、特定の酸を反応させることで熱と泡を放出しながら灰褐色の砂になる、という発見がなされ、これまでは大地でしかなかった物質としての煉瓦を未来の熱/動力源として活用できる理論として注目を集めている。
「大解体」という時代
大解体の歴史を振り返って思うのが、〈塔〉は先人が回転動力を保存するために積み上げたものなのではないか? ということだ。そう考えると、構造材ではない煉瓦が大量に積載されていた理由に見当がつく。つまり、〈塔〉は回転動力を高所に置いた煉瓦という形で保持している、と考えることができるからだ。先人たちは何の目的のためか、めいっぱいにこの大きなゼンマイを巻いたのだ。われわれは少しずつ〈塔〉というゼンマイが蓄えた回転の力を動力に変え、熱に変え、長い灰の時代を乗り切ってきた。
書架を燃やした灰も、本を燃やした灰も、それ以上燃えることはない。ただの砂は酸をかけても熱を出すことはない。そして、平坦な場所に置かれた煉瓦は動力に変えることができない。灰の時代がくる前に生み出されたものを、われわれはひとつひとつ混沌へ/一番なんでもない状態へと返していくことで得られる熱で生きてきた。
近年の観測では徐々に積灰量が減っており、近いうちに灰の時代が終わるとする仮説が提唱されている。しかし、煉瓦層の下の大解体以前の深層探査では、灰の時代は数千年の周期で訪れているという地質証拠が発見されており、今紀の灰が明けてもいずれ次の灰の時代が訪れる可能性が高いと予測される。
とするならば、灰が落ちきったときに我々がすべきことは、新しい回転動力源を探して解体し続けることではなく、崩した煉瓦を積み上げ直すことではないだろうか? 前の灰の時代を生き延びた先人も、その前の先人も、ゼンマイを巻くように煉瓦を積み上げてきたのではないだろうか? そうやって、大解体と
この営為は一見、河原の石を積み上げては崩す不毛なものにも思えるが、たしかに我々に連なるものである。もう一度煉瓦を積み上げる日を、前よりも一段でも高く積み、いつかその余力が灰のない未来へ続く日を願って、筆を置く。
ト-412