Matter Mind Meaning

思ったことを忘れてしまわないように書き留める

2015-04-13から1日間の記事一覧

NLTK : 英語の文章を文または単語単位で分割する

論文中で、nltkを使って文章を文単位に分割したという記述が出てきたので、具体的にどうやってやるのか調べた。 文単位の分割 >> from nltk.tokenize import sent_tokenize >> text = "This is a pen. Is this a pen?" >> sent_tokenize_list = sent_tokeniz…

論文紹介: A Bayesian Approach to Unsupervised Semantic Role Induction

概要 紹介論文[Titov and Klementiev 2012] では、教師なし学習により意味役割を付与する。これは述語項同定と項のクラスタリングからなる2ステップで行われる。述語項同定は依存構造木からヒューリスティック手法を用いて判別する[Lang and Lapata 2011]。…