Matter Mind Meaning

思ったことを忘れてしまわないように書き留める

確率モデルとしての脳

脳の機能は感覚入力を元に外界の状態を確率的に予測することであるという仮説が提唱されている。この仮説によれば、脳は事前知識と過去の感覚入力を 元に未来の感覚入力に対して確率的予測を計算する。このとき、この確率値の元で新たな感覚入力が与えられたときの尤度が最大となるように予測を行う。尤度 が高いほど驚きが少ないことから、脳の機能は驚きを最小化することであるとも解釈される。

もちろん、まともな認知理論はどれも不確かな情報を予測する理論を含まなければならない。この仮説が他と異なるのは、確率論に基づいて予測が行われるこ と、予測を脳の機能の中心とすることである。将来の感覚入力がどうなるかについての最良の予測を立てることに脳のすべての機能が関わると考える。

外界からの感覚入力に対する驚きを最小化するという枠組みは、学習、知識、運動、知覚、注意などの認知機能を統一的に扱うことが出来ると主張されている。

知覚は感覚入力に合わせて予測を更新することで将来の驚きを下げる。例えば、家から外に出て空が曇っていることに気付いたならば、道を歩くときに周りの通行人が傘を持ち歩いていることに対する驚きは少なくなる。

運動は予測に合うように外界の状態を変化させることで驚きを下げる。運動の意図は感覚入力に対する予測と区別されない。喉が渇いたときに水を飲みたいとい う欲求は、近い将来に水を飲むだろうという予測と区別されない。この場合、水を飲まないことは予測に反するために驚きを大きくする。従って、驚きを下げる ためには水を飲む行為を行うようになる。

知識や技能は予測のための事前分布であり、学習は事前分布のモデルやパラメータの値を決定する。空が曇ると雨が降りやすいという知識や、外で雨が降ったと きには傘をかけるという知識は、通行人が曇りの日に傘を持ち歩くだろうという予測を導く。知識の有用性は予測の結果生まれる驚きの大きさによって定まる。

注意は感覚入力の観測の方法を定める。情報処理能力に限界がある場合、情報量が最大となる情報源から集中的に観測データを取得することが最良の予測を行う 上で必要であり、感覚入力の一部に注意を向けることでこれが実行される。例えば、目の前にいる人の気分を知りたいときには、視線を動かしたり、意識を集中 することで、その人の顔に関わる感覚入力に注意を払うことが役に立つ。

この枠組みは、認知機能を統一的に扱える他に、以下のような利点を持つ。

第一に、確率的に予測することは感覚入力の性質に本質的に備わっている不確かさに最適に対処する。外界の状態がいくつかの可能性のうちのひとつに分類さ れ、どの可能性に分類されているかによって行うべき最善の行動が変わると仮定する。また、最善の行動とは行動の結果もたらされる効用が大きいものであると する。感覚入力だけから外界の状態を決定することは不可能であるので、外界の状態の可能性をひとつに絞ることは出来ない。従って、不確かな情報に基づいて 行うべき行動を決めなければならない。このとき、感覚入力を与えられたときの外界の状態の条件付き確率を知ることが出来れば、効用の期待値を最大化するこ とのできる行動を計算することが出来る。この意味で、確率的予測は感覚入力の不確かさを最もうまく処理することが出来る。

第二に、異なる感覚器官の情報を統合して予測を行うときにヒューリスティックを必要としない。外界に存在するあるひとつの要素の状態について、関連する感 覚入力が複数の経路から来るとしよう。例えば、鳥の鳴き声と姿を観測したという状況がこれに当てはまる。鳴き声と姿をもとに鳥の属する種を知ろうとするな らば、この2つの情報を統合しなければならない。確率モデルが外界の要素を表す変数と関連する感覚入力を表す変数を確率変数として含んでいれば、汎用的に 使うことが出来る数学的方法を使って、必要な計算を行うことが出来る。すなわち、モデルさえ定義してしまえば、計算方法を定義する必要はない。もちろん計 算量の問題から技巧的な近似計算法を利用することはあるが、それは別の話であり、原理的には公式の計算方法が存在するということが重要である。

第三に、記号に基づくトップダウンの理論では捉えられないような認知の柔軟な側面を表現することが可能になる。記号は認知過程や概念を簡潔に表すのに便利 だが、これらに付きまとう言葉では表せない側面を表現するのは困難である。例えば、動物のカテゴリに昆虫が入るかどうかは状況により変化し得る。このよう なカテゴリへの帰属の状況依存性は集合論に基づく記述的な理論では扱いにくい。確率モデルはこのような性質をパラメータとして数値的に表す。パラメータの 値は確率モデルの通常の推定方法で定めることが出来る。パラメータの意味に関して明確に議論することは不可能になるが、少なくとも暗黙的な方法で非記号的 な柔らかい知識を表現することが出来る。

第四に、確率モデルは科学的な概念であり、実験により検証することが可能である。モデルが説明する観測データに関する尤度とモデルの複雑さを考慮すること で、あるモデルが他のモデルに比べて良いか悪いかを比較することが出来る。特に、知覚、運動、情動、知識などの認知的な概念が厳密に定義されることが重要 である。これらの語彙は日常生活の際に使用されるもので、曖昧な意味を持つ。確率論に基づく厳密な定義を与えることで、認知理論は科学的な検証に耐えうる ものになる。

第五に、確率モデルは情報の符号化を効率的に行う。脳内にはいろいろな情報が行き来するが、それらは電気信号として符号化されている。当然、一定の情報量 を符号化するのに必要な符号の長さは短ければ短いほど良い。これを最もうまく達成するためには、情報の生成確率を知ることが必要である。確率モデルは常に 情報の確率分布を計算しているため、符号化を効率よく行うことが出来る。

では、脳が確率的予測機械であるとする仮説を支持する証拠はあるのだろうか。

欲しいのは、神経細胞の発火が確率変数の値や、統計量、予測誤差を符号化しており、感覚入力によって予測を更新していることを確かめられるような証拠である。神経細胞の符号化方式に関してわかっていることは少ないので、このような直接的証拠を得ることは技術的に難しい。

ここでは、視神経についての証拠を紹介する。視神経は網膜にある神経で、ここに視覚に必要なすべての感覚情報が入ってくる。しかし、視神経による情報は物 体認識などの高次の情報処理を行うには不適切である。カメラの画素のようなもので、それぞれの視神経は視野の特定の位置での色や明るさを符号化する。当 然、目に映る情報の意味については何も語らない。実際、同じ文字を見ているとしても、視線を少し動かしただけで、それぞれの視神経に入る光は全く異なった ものになってしまうので、視線を動かす前後で同じ文字をみていることは視神経の段階での情報処理では判断することが出来ない。このような高次の情報の処理 は視神経から大脳の中心部にある視床下部を中継し、第一次視覚野からはじまる視覚野で処理される。

視神経がカメラの画素に類似しているとしたが、大きな相違も存在する。それは、視神経の段階ですでに大規模な情報処理が行われていることである。この事実 は、神経細胞の情報処理の詳細について知らないでも、単純な事実によって理解することが出来る。それは、視神経から視床下部へ入力する神経線維(軸索)の 数は網膜に存在する視神経の総数の100分の1であるという事実である。すなわち、網膜で表現されている情報がどのようなものであれ、それは大脳の視覚野 に入るときには100分の1以下になっているということである。

なぜ、大脳に行く情報が網膜で処理される情報よりも圧倒的に少ないのか。脳が確率機械であるという見方は、この問いに答えを提供する。

視神経の特徴として空間的抑制と時間的抑制がある。空間的抑制は視神経に伝わる光がそれに隣り合う視神経に伝わる光と類似している場合、その視神経は発火 が抑えられるという性質を指す。視神経が光に対して最も敏感になるのは、光の絶対強度ではなく、まわりの比較したときの相対強度であり、空間的抑制は光の 強度の空間的差異を強調する効果を持つ。

時間的抑制は同一の視神経において、そこに入る光の強度の時間的差異を強調する。つまり、現在入る光の強度とその直前の光の強度の差が大きいほど発火しやすくなる。時間的抑制は視神経を「ちらつく」光に最も反応させるようにする。

空間的抑制と時間的抑制は、確率的情報処理の枠組みでは、予測符号化と呼ばれる技術を使用していると考えられる。予測符号化は、情報源符号化の一種であ る。送信者と受信者が情報源に対する確率モデルを共有しており、それまでに観測された情報を元にして、これから観測される情報を絶えず予測する。送信者 は、情報が予測と一致しない場合だけ、送信者に送る。情報が予測と一致する場合は、何も送らない。送信者は、受信者から信号が来ない場合は自分が持ってい る情報源の予測モデルを使って、情報源から発生した情報が何であったかを決まることが出来る。このようにして、予測符号化は予測した情報が実際に観測した 情報と正しい割合だけ、情報を圧縮することが出来る。

空間的・時間的抑制は、視神経が受け取る情報を空間的・時間的に予測し、予測と食い違う観測がなされた場合のみ発火を行わせることで情報を伝える。このよ うに考えれば、大脳へ連絡する軸索の数が視神経よりも少ない理由が説明できる。網膜で行われているのは予測と実際の観測結果の不一致を検出することであ り、検出された不一致のみが大脳に連絡される。不一致を検出するには実際の観測を行う必要があるので、それに見合った数の細胞を容易する必要があるが、情 報を送るだけならば、予測符号化により大幅に圧縮を行うことが出来る。

脳が確率機械であるという仮説を裏付ける証拠は今のところ少ない。しかし、この仮説が魅力的であることは確かである。