Matter Mind Meaning

思ったことを忘れてしまわないように書き留める

機械が仕事を奪う時代

米大統領選で最大の争点となっている問題は、「雇用をどのように生み出すか」である。アメリカではリーマンショック以来、中流層の多くが職を失い、景気が持ち直した今でも失業率は高いままになっている。

2011年7月、つまり不況が公式的に終わってから25ヶ月後の時点で行われた調査は、アメリカの雇用問題の深刻さを如実に示している:

 ・アメリカの失業率は9.1%だった。失業率は不況時の最悪の時点と比べて1パーセント以下しか改善していない。

 ・労働参加率は64%に下落し、多く女性が労働に関与していなかった1983年以来最悪の水準になった。

 ・2011年の中間においてアメリカの平均失業期間は39.9週に及び、戦後の最悪の時点よりもおよそ2倍長くなっている。

一方で、アメリカの景気状態はこれと矛盾するかのように見える:

 ・不況が終わってから7四半期を通したGDP成長率は2.6%である。これは48年から07年までの平均的成長率よりも75%大きい。

 ・同じ時期にアメリカ企業が生み出した利益は過去最高となっている。

 ・2010年には設備とソフトウェアに対する投資がかつての最高点の95%にまで回復した。この回復率は過去最高のものである。

経済学において一般的だと考えられている傾向は、景気が良くなり企業の利益が増加すれば雇用が生まれ失業率が減少するということである。

ところが最近のアメリカではこれが成り立っていない。

景気はよいにもかかわらず、職がないのである。

このパラドックスについての説明はいくつも考えられているが、その中でも特に説得力を持つのは機械の生産性の向上を原因と見る考え方である。

この考え方では、世界全体の需要の伸びをはるかに上回るペースで機械の生産効率が改善されていると仮定する。

従来型の経済では、消費市場での需要が上がれば、企業は供給量を増やすために2つのことをする必要があった。1つは設備投資であり、もう一つは労働力の確保である。

供給量を固定して考えるとき、機械の生産効率が増加すると、必要な財を生み出すための労働力は相対的に少なくなる。従って、生産効率の増加幅が大きいと需要の増加による必要な労働力の増加は打ち消されることになる。

これにより、景気が良いにもかかわらず失業率が高いことをうまく説明できる。

ところで、機械の効率化、あるいは技術革新のスピードが加速していくことが考えられる。例えば、情報革命はまだ始まったばかりであり、IT技術により生産技術はさらに効率化されることが予想される。従って、上に述べた考えに基づけば、将来的には景気の良し悪しに関わらず雇用が減少していく可能性が考えられる。

幸いにも技術革新は生産性を向上させるので、社会全体が生み出す財の総量は概して多くなる。問題は雇用の絶対量が減少することであり、これにより格差が広がってしまうことが懸念される。

この様な時代においては、富の再配分をより強化することが社会全体の幸福につながる。

<書評> Ray Kurzweil 著 "How to Create a Mind"

最近読んだ本、"How to Create a Mind" が面白かったので紹介する。

この本の内容は、どのように人間の心を人工的に作るかに関するものである。近年の脳科学と人工知能の成果を紹介しながら、人間の知能の本質について平易に解説している。他にも、最近注目を集めているIBMのWatsonやAppleのSiri,Googleの自動運転車などの技術や、人間の自由意志と自我の問題、そして情報技術の指数関数的成長について触れている。

著者のカーツワイルは発明家として有名で、米国発明家の殿堂に入っている他、3人の大統領から表敬されており、「エジソンの正当な後継者」と呼ばれている人物だ。

カーツワイルの主張で印象的だったのは以下の点だった。

・人間の脳は基本的なパターン認識モジュールがいくつも繰り返されたものである。

・人間の知能は階層的で、情報は低い階層から徐々に高い階層へと伝達される。

・基本的なモジュールの動作さえ解明すれば、そのモジュールを組み合わせることにより脳のような複雑なシステムを構成する事が出来る。

・脳が行っている計算は本質的にはコンピュータで再現できる。

・2020年代には人間の脳全体のコンピュータシミュレーションが可能になる。

・人間の意識は物質そのもの(ハードウェア)ではなく物質の動きのパターン(ソフトウェア)である。

 

特にカーツワイルの、人間の知能がいくつもの基本的なパターン認識モジュールによって構成されるという主張は説得力がある。

人間の脳は通常、部位によって役割分担が決められている。例えば、視覚情報は後頭葉で処理し、意思決定は前頭前野で、言語処理は側頭葉で処理するという具合だ。

ところが生まれたときから全盲の人の場合、健常者とは役割分担が異なる。本来、視覚情報を処理する後頭葉で言語処理を行っていたりする。

このような脳の役割分担の変化の柔軟性は、脳の全ての部位が、生まれたときから均質な構造をしており、学習によって機能分化をしていくと考えれば説明がつく。

また、大脳皮質は解剖学的に、大脳コラムと呼ばれるモジュール構造を備えている。各大脳コラムは数百個のニューロンの集合体で、円柱状になっている。また、情報処理が各コラムごとにある程度独立した形で行われているという実験証拠が存在する。

従って、大脳は大脳コラムのようなモジュールがレゴのブロックのようにいくつも繰り返されたものであり、情報処理の役割分担はこれらのモジュールの一つ一つが協調して学習することで実現されると推論できる。

人間の知能が階層的であるという主張も同様に説得力がある。

例えば視覚情報処理を考えてみる。視覚情報処理は幾つかの段階を経て行われる。初期の段階では網膜に映った画像のうち、微小な区間に映った線分の傾きや色、動きが検出される。さらに段階が進むと、円や四角形、T字型など簡単な図形が検出され、最終段階では人の顔や体が検出される。このように情報は処理の段階が進むにつれ、抽象化・一般化される。このように視覚情報処理はピラミッドのような階層性を備えている。

言語の処理についても同様の事が言える。まず耳から入った音声は、周波数帯域ごとに細かく分割される。次に音声が単語を表す事が検出され、次に文節、次に文全体が検出される。

また、カーツワイルは言及していないものの、2006年ごろから、深い階層性を持つ機械学習システムを利用するDeep Learning と呼ばれる手法が大変な注目を集めている。実際、Deep Learning の枠組みで開発された、深い階層構造をもったニューラルネットワークが、機械学習の多くのベンチマークテストで世界最高記録を更新している。

従って、実際の脳でも、人工的なシステムでも、階層的な構造が有用であるように思われるため、カーツワイルの主張にはうなずける。

一方、この本で残念だったのは以下の点である。

・物事を単純化しすぎている。

・自由意志や自我などを扱っている箇所は論理展開が貧弱。

・自分や自分の会社の業績を宣伝しすぎ。

ニューラルネットワークの能力を過小評価している

最後のニューラルネットワークについての点だが、カーツワイルは完全にこの技術の最近の進展を理解していないようで残念だった。個人的には今後の人工知能の研究でニューラルネットワークは最も熱い分野になると思うからだ。

 

全体としては、人間の知能について分かりやすく解説されており、さらに工学的に知能を実現する際の役に立つ指針も多く得る事ができた。読んで損はない本だった。知能に関心がある多くの人におすすめできる本である。

類推

人間の思考における類推の役割について論じる。類推とは、異なる概念の間に共通点をみつけ、一方の概念についてわかっている知識を、もう一方の概念に適用する認知的過程である。類推は人間の思考において中心的な役割を果たす。

表面上、関係が無いように見える事柄を同じ言葉で表現することは、言語の使用において広範に観察される。以下の例での、開く、及び、開けるという単語の意味について考えてみよう。

a ドアを開く
b 本を開く
c コーヒーを開ける
d 心を開く

それぞれの例において、動詞が表す物理的動作は全く異なっている。aの例では、「開く」は、ドアノブを握って、腕全体を押したり引いたりする動作を指すのに対し、bでは本の上半分のページを180度回転させる動作を指している。また、cの例でコーヒーの缶のタブを人差し指で引くことを指しており、腕の動作は重要視されない。最後の、eの例では、そもそも身体的運動が伴わっていない。

このように同じ言葉が使われていても、厳密な意味に明らかな違いがあるという例は、自然言語において広範にみられる。むしろ、このような性質を持たない言葉を見つけるほうが難しい。数学やプログラミング言語などの形式言語では、自然言語の場合とは異なり、意味の多様性は存在しない。

「開く」の例のそれぞれの文は、厳密には意味が異なるとはいえ、それらの意味の間には多くの類似性があるように思える。このような類似性を人間の心が認識することは、いったいどのように認知に役だっているのだろうか。

この問題に関する答えは、類推を行う能力と密接に関係する。すなわち、異なる概念間の類似性を認識することは、類推の使用を可能にする。これが概念の理解を用意にする。

具体的にこのことを説明する。

容器を開くと、その容器の中にある内容物が外に出ることが可能になる。

この性質から類推を行うことにより、以下の事柄が理解される。

a ドアを開けば、部屋の中の人が外に出ることが可能になる

b 本を開ければ、書いてある内容を読む人が取り出すことが可能になる

c 缶を開ければ、コーヒーが缶から出ることが可能になる

d 心を開けば、心の中にある思いを周りのひとが取り出すことが可能になる

このように、ベースとなる基本的な概念に関する知識を、類推によって他の概念に適用することによって、理解が促進される。

マイクロワールド

人工知能の歴史の初期には、実世界と比べて単純化された仮想的な世界(マイクロワールド)での問題解決の研究が行われた。最も有名なのはミンスキーの学生たちが行った「積み木の世界」の研究だろう。この世界では、積み木とそれを操作する腕が存在し、エージェントは腕を使って積み木を動かし、様々な課題を解く。積み木の世界はコンピュータの中だけでなく、現実の積み木とロボットをつかったものも作られた。積み木の世界の集大成はウィノグラードが開発したSHRDLUで、これは自然言語による命令や質問を理解して積み木の世界で適切に振る舞うことができた。SHRDLUは言葉の意味を手続きに関連付けて理解し、「大きな積み木の上にある赤い積み木をその手前にある青い立方体の上に置け」などという命令を文脈を考慮した上で実行することが出来た。

マイクロワールドの研究はもっと見直されるべきだと思う。自動運転技術や、画像認識、機械翻訳、ファクトイド質問応答などでビッグデータ主導の最近のアプローチは大成功を収めているが、マイクロワールドの中での知能についての研究はこれと相補的だと思う。

まず、マイクロワールドの概念について、僕が考えていることを説明する。マイクロワールドは私達が生きている世界の縮小されたモデルだと考える。そこには時間と空間と物体が存在し、物体の振る舞いを支配する物理法則が定められている。さらに、自律的に動き世界に影響を与えることが出来る物体として、エージェントが存在する。マイクロワールドは現実世界のモデルではあるが、様々な単純化が行われる。例えば、時間・空間が有限であったり離散的であったりしてもよい。水や空気のような流体が存在せず、物体はすべて剛体として振舞っても良い。摩擦や重力などの物理法則は、近似的であってもよい。

手書き数字認識のデータセットであるMNISTデータを識別するシステムはマイクロワールドではない。単なる識別器は自律的に振る舞うエージェントとしては認められない。マイクロワールドにおけるエージェントはただ知覚システムを持つだけでなく、まわりの環境に作用する効果器を備えなければならない。囲碁やチェスなどのゲームの世界もここで述べる意味でのマイクロワールドではない。勝ち負けを競うゲームは私達が生きる現実世界のモデルとしては不適切だと考える。

マイクロワールドは現実世界と「類似した」時間と空間を持たなければならないと思う。積み木の世界にはこれがあった。物体は空間を「移動する」ことが出来たし、物体を「持ち上げて」、他の物体の上に「落とす」ことが出来た。「」でくくった単語は、実世界と積み木の世界で似通っていることは誰もが認めるだろう。

マイクロワールドが現実世界と類似していなければならない理由は、生物が進化の結果獲得した知能が、この世界の有り様に強く依存すると考えられるからだ。特に、物理的な世界において運動を行う能力は、運動そのものだけでなく、様々な認知能力に関わると考えられる。ジョージレイコフとマークジョンソンが指摘したのは、人間が抽象的なことについて考えるとき物理世界における運動を起源とするメタファーを多用することである。「株価が下落する」、「2人の関係は大きな壁に直面した」などはその例で、このような例は日常的、専門的問わず、あらゆる思考に普遍的にみられるといってもよい。

現実世界そのものを対象にして、ロボットを作ればいいじゃないかという声が聞こえそうだ。しかし、現実世界そのものを単純化しないで扱うことは、複雑さを増やすだけだと思う。ロボットを使う場合、努力の大部分がささいな問題を解くために使われるという場合が多い。コップを持ちあげたいとする。このとき、膨大な処理が行われる。ロボットはカメラの映像からコップを認識し、コップまでの距離やコップに液体が入っているかどうかなどを検出しなければならない。さらに自由度の大きいロボットアームを動かして、コップを落としたりしないように持ちあげなければならない。

このような問題に注力するあまり、別の問題を見落としてしまう。例えば、ロボットが人間に水を飲ませるたいとしよう。ロボットが行わなければならないのは、コップを探し、それを持ち上げ、持ったままで水道まで行き、蛇口をひねって水を注ぎ、水がコップから出ないように注意を払いながら人間のそばに行き、水を入ったコップを渡すことである。この一連の行動をロボットが自分で計画し、実行するには、優れた知能が必要である。しかし、ここで使われた知能はコップを持ち上げるのに使われた、現実世界の複雑さが困難さの原因となっている課題とは質的に異なるのではないかと思う。両方が重要なのだが、現実世界でロボットを動かす場合、コップを持ち上げるだけで手一杯になり、もう一方の側面については注意がおろそかになる。

もちろん、だからといって現実世界の複雑さ、不確かさをまるっきり無視した、記号処理の世界を支持するわけではない。マイクロワールドは現実世界と記号処理の世界という両極端の中心に位置する。コップを動かすことには複雑なパターン認識や運動制御が必要だが、その複雑は現実世界に比べて大きく単純化されている。これにより、コップを動かすことと、より高次の行動計画の問題とを同時に取り扱うことが可能になる。

というわけで、マイクロワールドは重要だということを主張したい。特に、言語の意味論を考える場合、最も有望なアプローチだと思う。言葉の意味は世界に関して何かを表現している。それは心的世界でも良いし、外界でもよい。だから、言葉の意味を理解するためにはそれが表現する世界がどのようなものであるかを確かめなければならない。マイクロワールドはこの目的のためにうってつけである。言葉を理解するときには、言葉が表す世界を再現する。

技術的特異点というメタファー

技術的特異点が2045年に訪れるとする説が、最近になってマスメディアにも登場するほどに広がってきた。「特異点」という言葉は元々、数学や物理学で使われていたもので、既存の定義や物理法則では現象を記述することが出来ない地点を指す。

 

「技術的特異点」は人工知能が自分よりも優れた新たな人工知能を作り出せる段階だと言われる。この段階に到達すると、人工知能が自らを改良し続けるループが生じ、その知的能力は一瞬で神とも呼ぶべき水準になる(知能爆発)。微生物が人間を理解できないのと同じくらいに、特異点後の人間は人工知能を理解することができなくなる。

 

この意味で、技術的特異点という言葉は数学や物理学でいう特異点のよいメタファーになっている。

 

 

共産党、国民連合政府樹立の呼びかけ!

9月18日の未明に行われた安保関連法案の可決を受けて、日本共産党安倍政権打倒のための野党の団結を呼びかけた。これは、安保法案を廃案にし、集団的自衛権を認めた政府の閣議決定をひっくり返すために、リベラル勢力で作る新しい政府が必要だと判断したためだ。

 

共産党は国民連合政府と呼ぶこの新しい政府を樹立するために、他の野党と選挙協力を行う方針だ。これは、それまで全小選挙区で候補を擁立し、他の野党とは一線を画してきた共産党にとって、大転換である。

 

国民連合政府は安保法案を廃案にするためだけに組織される臨時的な政府であり、目的を達した場合には速やかに解散し、新しく総選挙を行うという。 

 

思えば、SEALDSが主導した先の国会前デモで、民主、共産、社民、生活の議員たちが共に演説を行ったときに、すでに野党共闘の兆しが見えていたのかもしれない。

 

共産党の呼びかけに対して、野党がどう応えるかに注目したい。

 

NLTK: 英単語の語幹を取り出す(stemming)

語幹(stem)とは単語を構成する形態素のうち、主な意味を担うものである。nltkでは語幹を取り出す関数が用意されている。

 

>>> from nltk.stem.porter import PorterStemmer

>>> st = PorterStemmer()

>>> st.stem("unbelievable")

u'unbeliev'

>>> st.stem("going")

u'go'

 

素晴らしい!

 

参考文献

nltk.stem package — NLTK 3.0 documentation