アニメと主観:3D世界から2Dアニメ世界への射影について

アニメーションと2つの口

先日、アニメの口の表現に関するツイートが流れてきた。

ひとつのフレームの中に「輪郭の口」と「顔のパーツとして書かれた口」の2つが描かれているわけで、別々の視点から見た口の状態を同じ絵の中に書いたこれは「キュビズム」ではないか、と言っているわけだ。

実はアニメーションや漫画において、3D的なパースを基準と考えたとき目や口のパーツが実際の位置よりもカメラ寄りに描かれることは非常によくあることで、我々はこのような表現に日常的に接している。上のツイートのリプライでも次のような例が挙げられていた。

今回は、2Dアニメの世界はどのような点で3DCGを撮影したものと異なるのか、という話をする。

3Dで見たらどうなのか

先の口の例について、「これって3D的に考えたらおかしいよね」という指摘はまさにその通りで、じゃあこのカメラ寄りの口を実際に3Dで見たらどうなのよ、の疑問に対する回答が、バーチャルYoutuberスズキセシルによる次のデモ動画である。

スズキセシルは自分のモデルが「2.5Dである」と言っており、キャラクターを撮影するカメラの位置に応じて3Dモデルを変形(モーフィング)することで、「カメラに寄った口」を再現している。

どうだろうか。動画右、移動カメラ(モーフィングあり)から見た目と口の表現は上で挙げたような「アニメ的」なもので、スズキセシルのキャラクターデザインがアニメ的なのもあいまって、私にはそこまで不自然には感じられなかった。

一方で、動画左の正面からの固定カメラ(モーフィングなし)でこのときのモデルの変形を見ると、「横カメラから見てそこまで不自然でない顔」は正面から見るとえらいところまで口が移動しているのがわかる。2Dアニメの「目と口がカメラに寄る」現象は3D的なパースに対してかなりの嘘をついているのだ。

ではなぜこのような「パーツのカメラ寄せ」をしているのかというと、その背景には技術的な問題と表現上の技法としての理由があることが指摘されている。

技術的な問題では、アニメ制作のコストにおいて「輪郭はなるべく動かしたくないが、口は動かしたい」事情があるようだ。表情芝居をしたい以上口を動かす必要があるが、輪郭を動かすと顔という大きなパーツを動かさなければならない一方で、輪郭を止めて口だけ動かすのであればフレームのごく一部を変更するだけでいいので簡単、というわけである。「パーツ口」と別に「輪郭の口」が残ってしまったのは、輪郭は輪郭で横から見た形を反映していないと横顔のシルエットが変わって不自然に感じられるため、といった理由があるのだろう。

表現上の技法としての理由は、アニメでは特にアニメ塗りが行われるために、表情筋の微妙な動きを表現する顔の奥行き方向の「深さ」情報が抜けているぶん、キャラクターの表情において口や目などのパーツが現実以上に大きな役割を果たしているという事情である。表情表現ではデフォルメされたパーツを使うなどの誇張表現もよく行われるので、「パーツが見える部分にあること」は表情表現の微妙な描写やバリエーションの多様化に非常に有効なわけである。

ツイートではキュビズムとの関連性が示唆されているが、キュビズムという技法自体が、伝統的な遠近法から脱却して画家の主観的・直感的視点による描写を試みたものであることを考えると、印象的なパーツを視点側に寄せるこの技法の精神性は、キュビズムに非常に近しいと言えるだろう。

3D的視点と2D表現の差異が大きなものとしては、スネ夫の髪や鉄腕アトムの頭(どの角度から見ても同じシルエットになる)などもあるが、今回は特に「3Dを2Dとして撮ろうとしたときのズレ」に着目し、2D的な極端な誇張表現については立ち入らないことにする。

2Dアニメと3DCG

近年のアニメ制作現場では、コストの削減などを目的として、キャラクターやアイテムを3DCGでモデリングし、オブジェクトや影をセルシェーディングでセルアニメのように着色する「セルルック・アニメーション」と呼ばれる手法が多く用いられるようになってきた。

セルルックは「3DCGをいかにして2Dアニメのように見せるか」という技術なわけで、まさにこの記事の疑問である「2Dアニメの世界はどのような点で3DCGを撮影したものと異なるのか」への大きなヒントになる。

セルルック・アニメーションの制作工程で一般の2Dアニメーションと大きく異なるのは、一番はじめに主要キャラクターの3Dモデルを作ってしまう、という点だろう。一度モデルを作ってしまえばあとはモデルのリギング(モデルの骨を動かすこと)によって任意の動き・構図を撮影できるようになるため、一枚一枚書きおろす必要がある2Dアニメ制作に比べて金銭・工数・時間面でのコストダウンができるわけである。

「目や口のパーツをカメラ側に寄せる」スズキセシルのように、モデルの段階で特殊な操作をすることはあまりなされないものの、「最終的にセルルックとして(2Dアニメっぽく)撮影したときに自然になるよう」3Dモデルのデザイン段階でなされる工夫もあるようだ。

a-film-production-technique-seminar.com

セルルックCG特有なワークフローとしてまずモデリングの手法が特殊な点があげられます。セルルックの表現では、単にモデルをデザイン画に合わせるかたちで形状をつくるだけでは、望むようなレンダリング結果を得ることはできません。セルルックの表現ははセルシェーディングと輪郭線で構成されるため、狙った場所に輪郭線が描画されるように、モデリング段階からそれらを意識しながら形状を作成していく必要があります。

例えば、鼻筋に輪郭線を描画させるために極端に細く鼻をモデリングするといったことがあります。

ここでは例として「極端に細く鼻をモデリングする」という工夫が挙げられている。セルシェーディング(アニメ塗り)するため、2Dアニメーションにおいて輪郭は3DCGのときよりずっと重要というのがその理由である。

ここまででずっと挙げてきた「口や目のパーツをカメラ側に寄せる」2Dアニメ的な表現については、シーンの必要に応じて、キャラクターのモデリングではなくアニメーションを作る段階で調整して達成されるようだ。

www.pixivision.net

f:id:xcloche:20200706223435j:plain
© Quadrangle / BBKBRNK Partners(リンク先より引用)

でも、パーツの配置と言いましたがアニメっぽさを追求するためにアニメーションの作業では精密に作ったモデルの整合性を壊す勇気も大事です。

── 整合性を壊す……?

ええと、例えばこの表情(←画像左)はいかにもアニメらしい表情ですよね。でもこの顔、パーツ配置の整合性は全くないんです。この表情を正面から見ると、こんな崩れた顔(画像右→)になっちゃうんです。

3DCGの一つの武器は、正面からでも横からでも整合性のあるモデルを動かせることだけど、それだと時には手描きのセルアニメらしい非現実的ではあるが魅力のある表情を表現できない。だから、あえてその整合性という武器を捨てることもあります。それがセルアニメを追求するという行為かなと。(一部省略、修正)

2Dアニメに特徴的な「動きかた」

ここまでのアニメを3D的なパースで見たときの不整合は静止画像について言えるもので、「じゃあ動いたらどうなのよ」という話になるとまた違った側面が出てくる。これについて、「どういうときに人はセルルックアニメーションを見て3D感を感じるのか」を研究した北大の人の論文(研究発表)があった。

https://dl.acm.org/doi/abs/10.1145/3283289.3283300dl.acm.org

(「pdf」からで2pの概要が読める)

この論文では、「動画が3DCGっぽく見える」原因としては「depth(奥行き)方向への移動による物体のサイズの変化」と「フレームレート」が大きいと指摘している。

研究で3D感の定量評価が行っているが、これには人間の主観が必要なため、12人の被験者にビデオを見せ、「2Dアニメを1、3DCGを5としたらこの動画はどのくらいか」「3D感を1〜5で評価したらどの程度か」の二項目に回答してもらう、という形式で調査したようだ。

奥行き移動によるサイズ変化

まず「depth(奥行き)方向への移動による物体のサイズの変化」について。研究では、対照群のオリジナルのビデオでは普通の視野角の透視投影で表示しているところを、「シーンの奥行き方向の移動が大きい場合はオリジナルより視野角の小さな透視投影、小さいときは平行投影を使う」よう視野角を調整することで3D感が減らせたと報告している。

f:id:xcloche:20200706223818p:plain

ここで、透視投影は上図(左)のように距離に応じて物体のサイズが変わる遠近のある図法で、視野角が大きければ大きいほど遠近による見た目のサイズ差が大きくなる。上図(右)の平行投影では遠近によって見た目の大きさが変わらない。

オリジナルのビデオに対して行っている調整はどちらも遠近によるサイズ差を小さくするもので、 奥行き方向の変化による見た目のサイズ変化が少ない投影法を使ったほうが2Dアニメっぽく見えるというわけである。

ただし、「キャラクターが画面方向にパンチしたのに拳が大きくならない」ような投影法は興ざめだろう(この状況は、相当離れたところから望遠鏡でこっちにパンチしている人を見る視点に対応する)。そこでこの論文では、同じシーン内でも距離に応じて投影法を使い分け、視点に近い部分では奥行きによる大きさ変化があるが、遠くでは変化しないという「いいとこ取り」のハイブリッドな手法を提案している。

f:id:xcloche:20200706223952p:plain

実はこのハイブリッド投影法、よくよく考えてみると現代のセルルック・アニメーション制作で部分的には自然に採用されている。というのも、2Dの背景画の書割の前で3Dの登場人物を動かすのは、平行投影と透視投影の併用に他ならないからだ。

フレームレート調整

次に「フレームレート」について。こちらは筆者らがこの研究の前研究で詳しく行っていたことのようだが、参考文献で引かれていた彼らの先行研究がオンラインで確認できる状態になく、この論文内でも詳しくは述べられていなかった。

周辺資料などから推測したところでは、どうやら「3Dっぽい(奥行き方向の)運動があった場合、フレームレートを落としたほうが2Dアニメっぽく見える」ということのようである。

奥行き方向の運動については視点方向への平行運動(カメラ方向に歩いてきたり向こうに行ったりする運動、拡大縮小に対応)と回転運動(その場でくるくる回るような運動)が挙げられており、そのような運動があった場合フレームレートを落とす(コマを減らす)ほうが2Dアニメっぽくなるとのことのようだ。

感覚的な理解としては「奥行き方向にヌルヌル動いたら3Dっぽい」といったところだろうか。

奥行き方向の運動の中でも、平行運動より回転運動の方が3Dっぽさを感じさせやすいようで、レート調整でより多くのコマを落とす意義があるようだ。

余談だが、「回転運動は3D感がマシマシになっちゃう」現象に関係しているのかわからないが、興味深いことに何人かのアニメ関係者が「セルルック・アニメーションで回転をなるべく避けたい」趣旨の発言をしていた。

mantan-web.jp

そこで、南プロデューサーが気をつけたのが「3DCGアニメとなると、グルグルと動く映像を作りがちだけど、ビックリ映像のオンパレード!のようなものは避けた」ことだ。

こちらは「蒼き鋼のアルペジオ」のプロデューサーの発言。

けものフレンズ」BD6巻付録オフィシャルガイドブックの「よしざきおにいさん × たつきおにいさん」特別対談(!)にも次のようなやりとりがある。

吉崎:打ち合わせをはじめて何回かはまずは内容そっちのけで3Dに関するディスカッションをしました。3Dで出来る事出来ない事、やってない事やらないほうがいい事っていうのをまず先に徹底的に洗い出してから、お願いする初期プロットをどういう構成にするか、3Dアニメをやるにあたってやめてほしい事とか伝えて。具体的には無駄に派手なアクションとかやめてくれみたいな事ですね。ぐるぐる回したりとか。

たつき:ぐるぐるはですね、今のアニメの偉い人って作画出身の人が多いので、作画でできない事を3Dに求めちゃうんですよ。せっかくだから回そうとか。ネイティブで3Dから育ってきてる人って逆にそれがちょっとダサいっていうのもわかってるので、真っ当に作りたがるんですよね。でもまさにやりたい所を言ってくださったから、「そうなんですよ〜!」って前のめりになって(笑)

吉崎:俺のモデルを回さないとは何事だ! みたいに怒られるかと心配してた(笑)

感覚的に回転運動によって3D感が強調されてセルルックの「アニメーションっぽくなくなる」ことを「ダサい」と認識しているのかもしれないと思うとおもろいな〜と感じた。

逆に、3Dっぽい作画

こういったものとまさに対照的に思ったのが『かぐや様は告らせたい』第3話EDの「チカっとチカ千花っ♡」で、これは3Dではなく完全に作画で書かれている(ロトスコープといって、実写撮影したダンサーの動きをトレースしたものらしい)のだが、奥行き方向にガンガン動いており、実に3Dっぽい。

www.youtube.com

評価としては「ヌルヌル動いていてすごい!」といった声をよく見たが、「これはアニメの動きではない」と批判している人がいたのが印象的だったのを覚えている。

まとめ

「パーツが視点側に寄る」話で言えば、絵を描くのが楽だからといっても、表現の幅が大きいからといっても、「なぜ我々はこれらの表現をそこまで「不自然」に感じないのか」は依然として不思議である。この「自然に見える」というのはある程度は生得的なものなのか、こういった表現に慣れているからそう感じるだけなのかはとても気になる。いろんな文化圏の人に斜め顔などを書いてもらって、「パーツの位置が3D的パースからどれくらいズレるか」を比較したらおもしろいかもしれない。個人的には文化によらず多少視点側に寄る傾向があるような気がする。人間は印象に残ったものを大きく描きそうなので。人間が顔をどのように認識しているかにもつながる話のように思う。

3Dアニメとの比較全般としては、2Dアニメの形式に存在していた目に見えない制約がどんどん可視化されておもしろい。

コスト面からもセルルック技術は今後も増えていきそうで、北大の人の研究が視点のハイブリッドを提案しているように、その「見えない制約」をうまく定式化して変換に活かすようなアイデアにはなるほどなあと思う。今は過渡期なので、セルルックで3DCGを2Dアニメっぽく見せる技術が発展するのと、セルルックが増えて3D特有の動きに視聴者がだんだん違和感を感じなくなるのは両方あると思っていて、今後どうなるかも注目していきたい。