小町守

630-0192 奈良県生駒市高山町8916-5
奈良先端科学技術大学院大学 情報科学研究科
自然言語処理学研究室

komachi@is.naist.jp

研究テーマ

現在外国人が日本語を学ぶとき、あるいは日本人が外国語 (特に英語) を学ぶときの学習支援、あるいは教育支援に 自然言語処理の手法を応用する研究をしています。 特に学習者が作文するときの誤り検出・訂正に焦点を当てています。

また、自然言語処理におけるグラフ理論を用いた半教師あり学習、 特に意味解析と情報抽出分野の研究を行っています。 最小限の人手作業で大規模コーパスから有用な知識を抽出する手法の 開発に取り組んでいます。ウェブデータを対象にした研究をしています。

統計的自然言語処理にも関心があり、統計的機械翻訳に統語知識と意味知識を 統合する手法の研究、日本語入力に統計的手法・機械学習を応用する研究、 誤り訂正に統計的手法・機械学習を適用する研究を行っています。

学歴

学部時代は文科系でしたが、大学院進学を機に自然言語処理に専攻を 変え、以後ずっと自然言語処理、特に機械学習・統計的手法を用いた 自然言語処理を専門としています。

2010年3月博士(工学)
奈良先端科学技術大学院大学情報科学研究科
博士論文テーマ: Graph-Theoretic Approaches to Minimally Supervised Natural Language Learning
(グラフ理論的観点からの自然言語処理における弱教師あり学習)
奈良先端科学技術大学院大学最優秀学生賞 (博士)
指導教員: 松本裕治
2007年3月修士(工学)
奈良先端科学技術大学院大学情報科学研究科
修士論文テーマ: Argument Structure Analysis of Event Nouns Based on Noun-verb Co-occurences and Noun Phrase Patterns
(名詞と動詞の共起および名詞句の語彙統語パターンを用いた事態性名詞 の項構造解析)
奈良先端科学技術大学院大学最優秀学生賞 (修士)
指導教員: 松本裕治
2005年3月学士(教養)
東京大学教養学部
学士論文テーマ: 植民地期の台湾における言語政策
指導教員: 岡本拓司
2002年2月-11月
The University of Sydney, Faculty of Arts
AIKOM (Study Abroad in Komaba) 交換留学生
哲学・言語学・歴史学の授業を履修 (言語学の授業2つで上位3-5%の学生にしか与えられない High Distinction を獲得)

研究歴

NTT 研究所との共同研究(実習生の期間を含めると4年間)、ヤフー 研究所との共同研究、海外 Microsoft Research と Apple Inc. でのインターンシップ(夏期研究実習生)など、 大学の非常勤講師・研究・教育補助員に止まらず、 実用化を視野に入れたさまざまなアプリケーションで必要とされる研究に 取り組んでいます。

2010年4月-現在
助教
自然言語処理学講座(松本裕治研究室)
奈良先端科学技術大学院大学情報科学研究科
大学教員としてウェブなど大規模で多様なデータを対象にした自然言語処理の研究をしています。
2010年5月-2011年9月
ソフトウェアエンジニア
アップルジャパン株式会社
自然言語処理技術の応用の研究開発コンサルタントをしていました。

(2010年以前の研究歴は省略します)

論文誌(査読あり)

学士の卒業論文を発展させた論文が1編、 国際会議採択論文を発展させた論文が5編論文誌に採録されています。 (うち1編人工知能学会論文賞受賞)

国際会議(査読あり)

トップ国際会議3件を含む13件の国際会議に採択されています。 2010年4月から教員になり、指導する学生との共著の論文が増えてきました。

国際会議 (その他)

機械翻訳を中心に、評価型の会議・ワークショップにも参加しています。

研究会・全国大会・シンポジウム等(査読なし)

大きく分けて4つの研究があります。 1つはブートストラップを中心とした半教師あり学習(言語処理学会最優秀発表賞受賞、情報処理学会山下記念研究賞および情報処理学会自然言語処理研究会学生奨励賞受賞(共著))、 もう1つは述語項構造解析(言語処理学会優秀発表賞受賞(共著)、情報処理学会自然言語処理研究会学生奨励賞受賞(共著))、 そして第二言語学習・言語教育特に日本語学習・日本語教育、 最後に統計的自然言語処理(情報処理学会自然言語処理研究会学生奨励賞受賞(共著))です。

解説・書評・項目執筆など

研究費獲得

研究代表者

研究分担者

受賞

2011年6月
人工知能学会2010年度論文賞「Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析」
(年間1-3件の論文に与えられます。2010年度は3件に与えられました)
2011年3月
情報処理学会平成22年度山下記念研究賞「ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得」
(年間100件中2件の発表に与えられます)
2009年3月
言語処理学会第14回年次大会最優秀発表賞「カーネル法を用いた意味的類似度の定義とブートストラップの一般化」
(200件中1件に与えられます)
2008年3月
言語処理学会第13回年次大会優秀発表賞「日本語書き言葉を対象とした述語項構造と共参照関係のアノテーション: NAISTテキストコーパス開発の経験から」
(200件中4件程度に与えられます)

教育

統計的自然言語処理の手法を中心に、講義と演習を担当しています。

担当講義・演習

論文審査委員

学会活動

プログラム委員として国際会議の査読に関わったり、国内の論文誌の査読をする一方、各種シンポジウムやワークショップの企画運営をしています。

海外

国内

社会活動

2004年6月-
Fink プロジェクト開発者
(Mac OS X のソフトウェア管理システム Fink の公式開発者で、Mac OS X で簡単に Unix のツールが使えるようにサポート していました。また、Apple WWDC Student Scholarship という奨学制度を 2006年と2009年に利用させてもらいました)
2003年7月-2007年10月
Gentoo プロジェクト開発者
(Gentoo Linux の公式開発者でした。 メインで担当していたのは CJK、日中韓など英語以外の言語のソフトウェアで、 ソフトウェアの設定ファイルを書いたり、他の人に書いてもらったパッチを 取り込んだり、ソフトウェアの導入ポリシーについて本家で議論・交渉したり していました)

雑誌記事

オープンソース開発活動で商業誌に定期的に寄稿していました。

招待講演・セミナー等

Gentoo Linux の本家公式開発者として招待講演をしていました。最近は産学連携や自然言語処理に 関する招待講演やパネル討論に招かれています。

その他の情報