Matter Mind Meaning

思ったことを忘れてしまわないように書き留める

機械が仕事を奪う時代

米大統領選で最大の争点となっている問題は、「雇用をどのように生み出すか」である。アメリカではリーマンショック以来、中流層の多くが職を失い、景気が持ち直した今でも失業率は高いままになっている。 2011年7月、つまり不況が公式的に終わってから2…

<書評> Ray Kurzweil 著 "How to Create a Mind"

最近読んだ本、"How to Create a Mind" が面白かったので紹介する。 この本の内容は、どのように人間の心を人工的に作るかに関するものである。近年の脳科学と人工知能の成果を紹介しながら、人間の知能の本質について平易に解説している。他にも、最近注目…

類推

人間の思考における類推の役割について論じる。類推とは、異なる概念の間に共通点をみつけ、一方の概念についてわかっている知識を、もう一方の概念に適用する認知的過程である。類推は人間の思考において中心的な役割を果たす。 表面上、関係が無いように見…

マイクロワールド

人工知能の歴史の初期には、実世界と比べて単純化された仮想的な世界(マイクロワールド)での問題解決の研究が行われた。最も有名なのはミンスキーの学生たちが行った「積み木の世界」の研究だろう。この世界では、積み木とそれを操作する腕が存在し、エージ…

技術的特異点というメタファー

技術的特異点が2045年に訪れるとする説が、最近になってマスメディアにも登場するほどに広がってきた。「特異点」という言葉は元々、数学や物理学で使われていたもので、既存の定義や物理法則では現象を記述することが出来ない地点を指す。 「技術的特異点」…

共産党、国民連合政府樹立の呼びかけ!

9月18日の未明に行われた安保関連法案の可決を受けて、日本共産党は安倍政権打倒のための野党の団結を呼びかけた。これは、安保法案を廃案にし、集団的自衛権を認めた政府の閣議決定をひっくり返すために、リベラル勢力で作る新しい政府が必要だと判断し…

NLTK: 英単語の語幹を取り出す(stemming)

語幹(stem)とは単語を構成する形態素のうち、主な意味を担うものである。nltkでは語幹を取り出す関数が用意されている。 >>> from nltk.stem.porter import PorterStemmer >>> st = PorterStemmer() >>> st.stem("unbelievable") u'unbeliev' >>> st.stem(…

NLTK: 単語数をカウント

単語数をカウントすれば、ストップワードやレアワードの辞書を簡単に作ることが出来る。nltkではこれを行う関数が用意されている。 >>> from nltk import FreqDist >>> text = "a a a b b a a c c d d e e w w a a z z d s q a f a a s w q f x a z a a a w …

論文紹介:Natural Language Processing from (almost) Scratch.

概要 フィードフォワードニューラルネットワークを用いて品詞タグ付け、チャンキング、固有表現抽出、意味役割付与のタスクに取り組む。意味役割付与以外は同じモデルを用いる。入力素性を作るための工学的負担は最小限にする。ラベル付けされていないデータ…

ニューラル言語モデルを高速化する2つの方法

ニューラル言語モデル(ニューラルネットワークによりn-gram確率を予測するモデル)は、2つの工夫をすることで、テスト時(学習が終わって、モデルを実際に使う段階)に高速化が可能である。 (1)出力層の正規化 ニューラル言語モデルは出力層にsoftmax関…

論文紹介: Modeling Events through Memory-based, Open-IE Patterns for Abstractive Summarization

概要 抽象的要約(Abstractive Summarization)は文の要点をみつけ、短い文で言い表すタスクである。ニュース記事の抽象的要約のためには、ひとつのイベントに言及するたくさんの文をまとめて抽象的に表すことが必要である。紹介論文では、文から抽出される…

論文紹介:Tagging the Web: Building a robust web tagger with neural network

概要 フィードフォワード・ニューラルネットワークを用いてWebテキストに品詞タグ付けを行う。ニューラルネットワークへの入力はWebテキストから学習された単語の分散表現と、スパースなn-gram に基づく素性が使われる。SANCL2012 shared taskによる評価では…

NLTK : 英語の文章を文または単語単位で分割する

論文中で、nltkを使って文章を文単位に分割したという記述が出てきたので、具体的にどうやってやるのか調べた。 文単位の分割 >> from nltk.tokenize import sent_tokenize >> text = "This is a pen. Is this a pen?" >> sent_tokenize_list = sent_tokeniz…

論文紹介: A Bayesian Approach to Unsupervised Semantic Role Induction

概要 紹介論文[Titov and Klementiev 2012] では、教師なし学習により意味役割を付与する。これは述語項同定と項のクラスタリングからなる2ステップで行われる。述語項同定は依存構造木からヒューリスティック手法を用いて判別する[Lang and Lapata 2011]。…

論文紹介:Information Extraction over Structured Data: Question Answering with Freebase

概要 FreeBase知識ベースを用いた質問応答は、open domain semantic parsingの発展のたたき台として注目されている。既存の多くの手法では、質問文を洗練された意味表現に直してから知識ベース中の回答候補と照応させている。これに対して、本論文(Yao et al…

脳はどうやって大きくなったか

ヒトとチンパンジーの遺伝子は95%ほど一致する。ところが脳の容積比は3対1と非常に大きい。ヒトだけが持つ5%の遺伝子のうちのどれかが人間の脳の大きさに影響を与えているはずである。この影響はどのようなものなのだろうか。これを知るためには、遺伝…

グレッグ・イーガン「白熱光」:銀河の中心での発見の物語

「白熱光」は、ハードSFの第一人者として知られるグレッグ・イーガンの邦訳最新作である。Kindle版を読んだ。面白かった。 小説は偶数章と奇数章で別の物語が展開され、章が進むにつれ2つの物語が接近していくという手法を用いている。 奇数章では、イーガ…

ボールドウィン効果ってすごい

あるところにラマルクという男とダーウィンという男がいた。ラマルクは、「生きている間に努力したことや学んだことは次の世代にも伝わるよ」と言った。ダーウィンは、「そんなわけ無いじゃん」と言った。時は流れ、獲得形質は遺伝しないということが確定し…

文の意味を表すためのアイデア

文法に従って単語を組み合わせることで、言葉が生まれる。同様にして、ある枠組みに従って、具体的な情報を組み合わせることで言葉の意味が表現されると考える。この枠組みをフレームと呼ぼう。フレームにはスロットがある。 文の意味は、適切なフレームを選…

確率モデルとしての脳

脳の機能は感覚入力を元に外界の状態を確率的に予測することであるという仮説が提唱されている。この仮説によれば、脳は事前知識と過去の感覚入力を 元に未来の感覚入力に対して確率的予測を計算する。このとき、この確率値の元で新たな感覚入力が与えられた…