小町守
630-0192 奈良県生駒市高山町8916-5
奈良先端科学技術大学院大学 情報科学研究科
自然言語処理学研究室
komachi@is.naist.jp
研究テーマ
- 第二言語学習・言語教育支援への自然言語処理の応用
- 大規模ウェブデータを用いた自然言語処理
- 統計的自然言語処理(機械 翻訳・日本語入力・誤り訂正)
現在外国人が日本語を学ぶとき、あるいは日本人が外国語
(特に英語) を学ぶときの学習支援、あるいは教育支援に
自然言語処理の手法を応用する研究をしています。
特に学習者が作文するときの誤り検出・訂正に焦点を当てています。
また、自然言語処理におけるグラフ理論を用いた半教師あり学習、
特に意味解析と情報抽出分野の研究を行っています。
最小限の人手作業で大規模コーパスから有用な知識を抽出する手法の
開発に取り組んでいます。ウェブデータを対象にした研究をしています。
統計的自然言語処理にも関心があり、統計的機械翻訳に統語知識と意味知識を
統合する手法の研究、日本語入力に統計的手法・機械学習を応用する研究、
誤り訂正に統計的手法・機械学習を適用する研究を行っています。
学歴
学部時代は文科系でしたが、大学院進学を機に自然言語処理に専攻を
変え、以後ずっと自然言語処理、特に機械学習・統計的手法を用いた
自然言語処理を専門としています。
- 2010年3月博士(工学)
- 奈良先端科学技術大学院大学情報科学研究科
- 博士論文テーマ:
Graph-Theoretic Approaches to Minimally Supervised Natural Language
Learning
(グラフ理論的観点からの自然言語処理における弱教師あり学習)
奈良先端科学技術大学院大学最優秀学生賞 (博士)
- 指導教員: 松本裕治
- 2007年3月修士(工学)
- 奈良先端科学技術大学院大学情報科学研究科
- 修士論文テーマ:
Argument Structure Analysis of Event Nouns Based on Noun-verb Co-occurences
and Noun Phrase Patterns
(名詞と動詞の共起および名詞句の語彙統語パターンを用いた事態性名詞
の項構造解析)
奈良先端科学技術大学院大学最優秀学生賞 (修士)
- 指導教員: 松本裕治
- 2005年3月学士(教養)
- 東京大学教養学部
- 学士論文テーマ:
植民地期の台湾における言語政策
- 指導教員: 岡本拓司
- 2002年2月-11月
- The University of Sydney, Faculty of Arts
- AIKOM (Study Abroad in Komaba) 交換留学生
- 哲学・言語学・歴史学の授業を履修
(言語学の授業2つで上位3-5%の学生にしか与えられない
High Distinction を獲得)
研究歴
NTT 研究所との共同研究(実習生の期間を含めると4年間)、ヤフー
研究所との共同研究、海外 Microsoft Research と Apple Inc.
でのインターンシップ(夏期研究実習生)など、
大学の非常勤講師・研究・教育補助員に止まらず、
実用化を視野に入れたさまざまなアプリケーションで必要とされる研究に
取り組んでいます。
- 2010年4月-現在
- 助教
- 自然言語処理学講座(松本裕治研究室)
- 奈良先端科学技術大学院大学情報科学研究科
- 大学教員としてウェブなど大規模で多様なデータを対象にした自然言語処理の研究をしています。
- 2010年5月-2011年9月
- ソフトウェアエンジニア
- アップルジャパン株式会社
- 自然言語処理技術の応用の研究開発コンサルタントをしていました。
(2010年以前の研究歴は省略します)
論文誌(査読あり)
学士の卒業論文を発展させた論文が1編、
国際会議採択論文を発展させた論文が5編論文誌に採録されています。
(うち1編人工知能学会論文賞受賞)
- 飯田龍 (東工大), 小町守, 井之上直也, 乾健太郎, 松本裕治.
述語項構造と照応関係のアノテーション:
NAIST テキストコーパス構築の経験から.
自然言語処理, Vol.17, No.2, pp.25-50, April 2010.
- 小町守, 飯田龍 (東工大), 乾健太郎, 松本裕治.
名詞句の語彙統語パターンを用いた事態性名詞の項構造解析.
自然言語処理, Vol.17, No.1, pp.141-159, January 2010.
- 小町守, 工藤拓 (Google), 新保仁, 松本裕治.
Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析.
人工知能学会論文誌, Vol.25, No.2, pp.233-242, January 2010.
(人工知能学会2010年度論文賞)
- 小町守, 牧本慎平 (ヤフー), 内海慶 (ヤフー), 颯々野学 (ヤフー).
ラプラシアンラベル伝播による検索クリックスルーログからの意味カテゴリ獲得.
人工知能学会論文誌, Vol.25, No.1, pp.196-205, January 2010.
- 小町守, 鈴木久美 (Microsoft Research).
検索ログからの半教師あり意味知識獲得の改善.
人工知能学会論文誌, Vol.23, No.3, pp.217-225, March 2008.
- 小町守.
台湾植民地期の言語政策: 安藤正次と二語併用の台湾
科学技術史, No.8, pp.31-55, 2005.
国際会議(査読あり)
トップ国際会議3件を含む13件の国際会議に採択されています。
2010年4月から教員になり、指導する学生との共著の論文が増えてきました。
- Toshikazu Tajiri, Mamoru Komachi and Yuji Matsumoto.
Tense and Aspect Error Correction for ESL Learners Using
Global Context.
In Proceedings of the 50th Annual Meeting of the Association
for Computational Linguistics: Short papers (oral). Jeju, Korea,
July 2012. (to appear)
(自然言語処理の世界トップ会議。採択率21%)
- Toshinobu Ogiso (National Institute for Japanese Language and
Linguistics), Mamoru Komachi, Yasuharu Den (Chiba University)
and Yuji Matsumoto.
UniDic for Early Middle Japanese: an Electronic Dictionary for
Morphological Analysis of Classical Japanese.
In Proceedings of the 8th International Conference on Language
Resources and Evaluation (LREC): Posters. Istanbul, Turkey, May 2012. (to
appear)
- Seiji Kasahara, Mamoru Komachi, Masaaki Nagata (NTT) and Yuji
Matsumoto.
Error Correcting Romaji-Kana Conversion for Japanese Language Education.
In Proceedings of the Workshop on Text Input Methods (WTIM 2011): Short
papers (oral). Chaing Mai, Thailand, November 2011.
(テキスト入力メソッドに関する世界初の国際ワークショップ。
採択率64%)
- Tomoya Mizumoto, Mamoru Komachi, Masaaki Nagata (NTT)
and Yuji Matsumoto.
Mining Revision Log of Language Learning SNS for Automated Japanese
Error Correction of Second Language Learners.
In Proceedings of the 5th International Joint Conference on Natural
Language Processing (oral). Chaing Mai, Thailand, November 2011.
(自然言語処理のアジアトップ国際会議。採択率約30%)
- Yuta Hayashibe, Mamoru Komachi and Yuji Matsumoto.
Using Discourse Context to Japanese Predicate Argument Structure
Analysis.
In Proceedings of the 5th International Joint Conference on Natural
Language Processing (oral). Chaing Mai, Thailand, November 2011.
(自然言語処理のアジアトップ国際会議。採択率約30%)
- Teruaki Oka, Mamoru Komachi, Toshinobu Ogiso (National
Institute for Japanese Language and Linguistics) and Yuji Matsumoto.
Automatic Labeling of Voiced Consonants for Morphological Analysis
of Modern Japanese Literature.
In Proceedings of the 5th International Joint Conference on Natural
Language Processing (oral). Chaing Mai, Thailand, November 2011.
(自然言語処理のアジアトップ国際会議。採択率約30%)
- Kei Uchiumi (Yahoo Japan), Mamoru Komachi, Keigo Machinaga
(Yahoo Japan), Toshiyuki Maezawa (Yahoo Japan), Toshinori Satou (Yahoo
Japan) and Yoshinori Kobayashi (Google).
Japanese Abbreviation Expansion with Query and Clickthrough Logs.
In Proceedings of the 5th International Joint Conference on Natural
Language Processing (oral). Chaing Mai, Thailand, November 2011.
(自然言語処理のアジアトップ国際会議。採択率約30%)
- Kohei Ozaki, Masashi Shimbo, Mamoru Komachi and Yuji Matsumoto.
Using the Mutual k-Nearest Neighbor Graphs for Semi-supervised
Classification on Natural Language Data.
In Proceedings of the Fifteenth Conference on Computational Natural
Language Learning, pp.154-162. Portland, USA, June 2011.
(自然言語処理の難関国際会議。採択率30%弱)
- Tetsuo Kiso, Masashi Shimbo, Mamoru Komachi and Yuji Matsumoto.
HITS-based Seed Selection and Stop List Construction for
Bootstrapping.
In Proceedings of the 49th Annual Meeting of the Association for
Computational Linguistics: Human Language Technologies, short paper,
pp.30-36. Portland, USA, June 2011.
(自然言語処理の世界トップ国際会議。採択率30%弱)
- Mamoru Komachi, Shimpei Makimoto (Yahoo Japan), Kei Uchiumi (Yahoo
Japan), Manabu Sassano (Yahoo Japan).
Learning Semantic Categories from Clickthrough Logs.
In Proceedings of the Joint conference of the 47th Annual Meeting of the
Association for Computational Linguistics and the 4th International
Joint Conference on Natural Language Processing of the Asian Federation of
Natural Language Processing (ACL-IJCNLP 2009): Short Papers, pp.189-192.
Singapore, August 2009.
(自然言語処理の世界トップ国際会議。採択率25%)
- Mamoru Komachi, Taku Kudo (Google), Masashi Shimbo and Yuji Matsumoto.
Graph-based Analysis of Semantic Drift in Espresso-like Bootstrapping
Algorithms.
In Proceedings of the Conference on Empirical Methods in Natural Language
Processing (EMNLP 2008), pp.1011-1020. Honolulu, USA, October 2008.
(機械学習・統計的自然言語処理のトップ国際会議。採択率21%)
- Masaki Noguchi (Tokyo Institute of Technology), Kenta Miyoshi (Tokyo
Institute of Technology), Takenobu Tokunaga (Tokyo Institute of Technology),
Ryu Iida, Mamoru Komachi and Kentaro Inui.
Multiple Purpose Annotation using
SLAT - Segment and Link-based Annotation Tool -.
In Proceedings of the 2nd
Linguistic Annotation Workshop, pp.61-64, May 2008.
(コーパスや辞書作成、そしてその作成を支援するツールの
唯一の国際ワークショップ)
- Mamoru Komachi and Hisami Suzuki (Microsoft Research).
Minimally Supervised Learning of Semantic Knowledge from Query Logs.
Proceedings of the 3rd International
Joint Conference on Natural Language Processing (IJCNLP-08), pp.358-365.
Hyderabad, India, January 2008.
(自然言語処理のアジアトップ国際会議。採択率28%)
- Mamoru Komachi, Ryu Iida, Kentaro Inui and Yuji Matsumoto.
Learning Based Argument Structure Analysis of Event-nouns in Japanese.
Proceedings of the
Conference of the Pacific Association for Computational Linguistics (PACLING),
pp.120-128. Melbourne, Australia, September 2007.
(環太平洋の言語学-工学の合同国際会議。採択率50%)
- Ryu Iida, Mamoru Komachi, Kentaro Inui, Yuji Matsumoto.
Annotating a Japanese Text Corpus with Predicate-Argument and
Coreference Relations.
Proceedings of the Linguistic Annotation Workshop, pp.132-139.
Prague, Czech, June 2007.
(同上)
国際会議 (その他)
機械翻訳を中心に、評価型の会議・ワークショップにも参加しています。
- Shuhei Kondo, Mamoru Komachi, Yuji Matsumoto,
Katsuhito Sudoh (NTT), Kevin Duh (NTT), and Hajime Tsukada (NTT).
Learning of Linear Ordering Problems and its Application to
J-E Patent Translation in NTCIR-9 PatentMT.
In Proceedings of the NTCIR-9 Workshop, pp.641-645. Tokyo,
Japan, Decemver 2011.
(情報検索の最大規模の国際ワークショップ)
- Joseph Irwin, Mamoru Komachi and Yuji Matsumoto.
Narrative Schema as World Knowledge for Coreference Resulution.
In Proceedings of the Fifteenth
Conference on Computational Natural Language Learning (CoNLL-2011 Shared
Task), pp.86-92. Portland, USA, June 2011.
(自然言語処理で共通タスクを決めて行なう最大規模の評価型会議)
- Mamoru Komachi, Masaaki Nagata (NTT) and Yuji Matsumoto.
NAIST-NTT System Description for Patent Translation Task at NTCIR-7
In Proceedings of the NTCIR-7 Workshop, pp.435-440. Tokyo, Japan, Decemver
2008.
(情報検索の最大規模の国際ワークショップ)
- Mamoru Komachi, Masaaki Nagata (NTT) and Yuji Matsumoto.
Phrase Reordering for Statisitcal Machine Translation Based on
Predicate-Argument Structure.
Proceedings of the International Workshop on Spoken Language Translation,
pp.77-82. Kyoto, Japan, November 2006.
(話し言葉の翻訳に関する国際ワークショップ)
研究会・全国大会・シンポジウム等(査読なし)
大きく分けて4つの研究があります。
1つはブートストラップを中心とした半教師あり学習(言語処理学会最優秀発表賞受賞、情報処理学会山下記念研究賞および情報処理学会自然言語処理研究会学生奨励賞受賞(共著))、
もう1つは述語項構造解析(言語処理学会優秀発表賞受賞(共著)、情報処理学会自然言語処理研究会学生奨励賞受賞(共著))、
そして第二言語学習・言語教育特に日本語学習・日本語教育、
最後に統計的自然言語処理(情報処理学会自然言語処理研究会学生奨励賞受賞(共著))です。
- 三谷亮介, 小町守, 松本裕治, 隅田飛鳥 (KDDI研究所).
極大部分文字列集合を用いたWebテキストの語義曖昧性解消.
言語処理学会第18回年次大会論文集, pp.1292-1295, March 2012.
- 水本智也, 坂口慶祐, 小町守, 内海慶 (ヤフー),
河野洋志 (ヤフー), 前澤敏之 (ヤフー), 佐藤敏紀 (ヤフー).
オークション検索クリックスルーログからの属性値抽出.
言語処理学会第18回年次大会論文集, pp.1023-1026, March 2012.
- 鳥倉広大, 小町守, 松本裕治.
Twitterを利用した評価極性辞書の自動拡張.
言語処理学会第18回年次大会論文集, pp.551-554, March 2012.
- 常吉高弘, 小町守, 松本裕治.
生成語彙論に基づく日本語の特質構造のランキング学習による自動獲得.
言語処理学会第18回年次大会論文集, pp.451-454, March 2012.
- 林部祐太, 小町守, 松本裕治, 隅田飛鳥 (KDDI研究所).
日本語テキストに対する述語語義と意味役割のアノテーション.
言語処理学会第18回年次大会論文集, pp.397-400, March 2012.
- 田尻俊宗, 小町守, 松本裕治.
大域的文脈情報を用いた英語時制誤りの検出と訂正.
言語処理学会第18回年次大会論文集, pp.357-360, March 2012.
- 藤野拓也, 水本智也, 小町守, 永田昌明 (NTT), 松本裕治.
日本語学習者の作文の誤り訂正に向けた単語分割.
言語処理学会第18回年次大会論文集, pp.26-29, March 2012.
- 笠原誠司, 藤野拓也, 小町守, 永田昌明 (NTT), 松本裕治.
日本語学習者の誤り傾向を反映した格助詞訂正.
言語処理学会第18回年次大会論文集, pp.14-17, March 2012.
- 小木曽智信, 岡照晃, 小町守, 松本裕治.
コーパス管理ツール「茶器」による単語情報付き古典語コーパスの活用.
人文科学とコンピュータシンポジウム (じんもんこん2011), pp.255-260,
December 2011.
- 笠原誠司, 小町守, 永田昌明 (NTT), 松本裕治.
日本語教育のための誤り訂正ローマ字かな変換.
情報処理学会第203回自然言語処理研究会,
Vol.2011-NL203, No.4, pp.1-6, September 2011.
- 岡照晃, 小町守, 小木曽智信 (国語研), 松本裕治.
機械学習による近代文語文への濁点の自動付与.
情報処理学会自然言語処理研究会, Vol.2011-NL201, No.6, May 2011.
(情報処理学会第201回自然言語処理研究会第86回音声言語情報処理研究会学生奨励賞)
- 林部祐太, 小町守, 松本裕治.
文脈情報と格構造の類似度を用いた日本語文間述語項構造解析.
情報処理学会自然言語処理研究会, Vol.2011-NL201, No.10, May 2011.
(情報処理学会第201回自然言語処理研究会第86回音声言語情報処理研究会学生奨励賞)
- 小町守, 飯田龍 (東工大). BCCWJに対する述語項構造と照応関係のアノテーション.
日本語コーパス平成22年度公開ワークショップ, pp.325-330. March 2011.
- 小町守, 木田泰夫 (Apple Inc.).
スマートフォンにおける日本語入力の現状と課題.
言語処理学会第17回年次大会論文集, pp.1095-1098. March 2011.
- 水本智也, 小町守, 松本裕治.
大規模添削コーパスを用いた統計的機械翻訳手法による日本語誤り訂正.
言語処理学会第17回年次大会論文集, pp.1007-1010. March 2011.
- 小嵜耕平, 新保仁, 小町守, 松本裕治.
ハブを作らないグラフ構築法を用いた半教師あり語義曖昧性解消.
情報処理学会第199回自然言語処理研究会. Vol.2010-NL199, No.19, Nov 2010.
(情報処理学会平成23年度山下記念研究賞)
- 内海慶 (ヤフー), 小町守, 町永圭吾 (ヤフー), 前澤敏之 (ヤフー), 佐藤敏紀
(ヤフー), 小林義徳 (ヤフー).
検索クエリログとクリックスルーログを用いた略語の展開候補獲得.
情報処理学会第199回自然言語処理研究会.
Vol.2010-NL199, No.19, Nov 2010.
- 小嵜耕平, 小町守, 新保仁, 松本裕治.
半教師あり語義曖昧性解消のためのグラフスパース化.
情報処理学会第196回自然言語処理研究会.
Vol.2010-NL196, No.19, May 2010.
(情報処理学会第196回自然言語処理研究会第81回音声言語情報処理研究会学生奨励賞)
- 小町守, 牧本慎平 (ヤフー), 内海慶 (ヤフー), 颯々野学 (ヤフー).
ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得.
情報処理学会第191回自然言語処理研究会.
Vol.2009-NL-191, No.9, May 2009.
(情報処理学会平成22年度山下記念研究賞・情報処理学会第191回自然言語処理研究会第76回音声言語情報処理研究会学生奨励賞)
- 牧本慎平 (ヤフー), 小町守, 颯々野学 (ヤフー).
ブートストラップを用いた検索クエリログからの意味カテゴリ獲得の分析
言語処理学会第15回年次大会論文集, pp.156-159. March 2009.
- 小町守, 森信介 (京大), 徳永拓之 (PFI). ChaIME:
大規模コーパスを用いた統計的かな漢字変換. 第3回 NLP 若手の会シンポジウム.
September 2008.
- 小町守, 森信介 (京大), 徳永拓之 (PFI).
あいまいな日本語のかな漢字変換.
情報処理学会夏のプログラミング・シンポジウム, pp.51-55. September 2008.
- 小町守, 工藤拓 (Google), 新保仁, 松本裕治.
カーネル法を用いた意味的類似度の定義とブートストラップの一般化.
言語処理学会第14回年次大会論文集,
pp.825-828. March 2008.
(言語処理学会第14回年次大会最優秀発表賞受賞)
- 飯田龍, 小町守, 乾健太郎, 松本裕治. 名詞化された事態表現への意味的注釈付け.
言語処理学会第14回年次大会論文集, pp.277-280. March 2008.
- 野口正樹 (東工大), 三好健太 (東工大), 徳永健伸 (東工大), 飯田龍, 小町守,
乾健太郎. 汎用アノテーションツール SLAT. 言語処理学会第14回年次大会論文集,
pp.269-272. March 2008.
- 小町守, 鈴木久美 (Microsoft Research).
検索ログを用いた意味知識獲得のためのブートストラップ手法.
電子情報通信学会言語理解とコミュニケーション研究会(NLC
2007-10), 信学技報 Vol. 107, No. 246, pp.13-18. October 2007.
- 小町守, 飯田龍, 乾健太郎, 松本裕治.
事態性名詞の項構造解析における共起尺度と構文パターンの有効性の分析.
言語処理学会第13回年次大会論文集, pp.47-50, March 2007.
- 飯田龍, 小町守, 乾健太郎, 松本裕治.
日本語書き言葉を対象とした述語項構造と共参照関係のアノテーション:
NAISTテキストコーパス開発の経験から. 言語処理学会第13回年次大会論文集,
pp.282-285, March 2007.
(言語処理学会第13回年次大会優秀発表賞受賞)
- 飯田龍, 小町守, 乾健太郎, 松本裕治. NAISTテキストコーパス:
述語項構造と共参照関係のアノテーション.
情報処理学会自然言語処理研究会予稿集・NL-177-10・, pp.71-78, January 2007.
(情報処理学会平成19年度山下記念研究賞受賞)
- 野口正樹 (東工大), 三好健太 (東工大), 徳永健伸 (東工大), 飯田龍, 小町守,
乾健太郎.
セグメンテーションとリンクに基づくアノテーションツールの設計と実装.
言語処理学会第13回年次大会発表論文集, pp278-281, March 2007.
- 小町守, 飯田龍, 乾健太郎, 松本裕治.
共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析.
言語処理学会第12回年次大会論文集, pp.821-824, March 2006.
解説・書評・項目執筆など
- [書評] 「自然言語処理の基礎」.
人工知能学会誌, Vol.26, No.2, pp.214-215, March 2011.
- [項目執筆] 「確率的言語モデルに基づくかな漢字変換」. 言語処理学事典. 共立出版.
p33, December 2009.
- [マニュアル] 菊池英明, 塚原渉, 小町守, 山田篤, 高梨克也. 『日本語話し言葉コーパス』XML
文書について. 2004.
研究費獲得
研究代表者
- 平成24年度
Microsoft Research CORE プロジェクト
「Learning L1-aware Error Models from
the Web」. 200万円 (200). (2012.04-2013.03; 予定)
- 平成23年度
科研費若手B
「自然言語処理における全体最適化のための大規模・超並列処理」
270万円 (150/120).
(2011.04-2013.03)
- 平成23年度
財団法人テレコム先端技術研究支援センター
SCAT研究費助成「大規模情報抽出のための頑健な述語項構造解析の研究」
250万円 (100/100/50).
(2011.04-2014.03)
- 日本学術振興会特別研究員 (DC2; 採用率21%)
「大規模なコーパスを用いた機械学習に基づく名詞句の項構造解析」
100万円 (50/50). (2008.04-2010.03)
- 奈良先端科学技術大学院大学 創造力と国際競争力を育む情報科学教育コアプロジェクト(CICP)
「大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換」
125万円. (2007.11-2008.03)
研究分担者
- 平成23年度
科研費基盤A「大域情報を利用した同時処理による自然言語解析手法の研究」
(研究分担者).
代表: 松本裕治 (奈良先端大).
(2011.04-2014.03)
- 平成22年度 人間文化研究機構 国立国語研究所
共同研究プロジェクト「統計と機械学習による日本語史研究」 (研究分担者). 代表:
小木曽智信 (国語研究所). (2010.11-2013.09)
- 平成22年度
科研費特定「代表性を有する大規模書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」
計画研究「書き言葉コーパスの自動アノテーションの研究」 (研究分担者). 代表:
松本裕治 (奈良先端大). (2010-2011)
- 2005年度情報処理推進機構(IPA)未踏ソフトウェア創造事業(未踏ユース) 「ユーザ参加型のパッケージ管理・斡旋システム」
(共同開発者). 代表: 吉澤智也 (東京大学) (2005.07-2006.03)
(採択率50%、年間300万円の開発費の支給を受け、ユーザのログを活用した
Mac OS X のソフトウェア管理システムの開発を行いました。)
受賞
- 2011年6月
- 人工知能学会2010年度論文賞「Espresso
型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析」
(年間1-3件の論文に与えられます。2010年度は3件に与えられました)
- 2011年3月
- 情報処理学会平成22年度山下記念研究賞「ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得」
(年間100件中2件の発表に与えられます)
- 2009年3月
- 言語処理学会第14回年次大会最優秀発表賞「カーネル法を用いた意味的類似度の定義とブートストラップの一般化」
(200件中1件に与えられます)
- 2008年3月
- 言語処理学会第13回年次大会優秀発表賞「日本語書き言葉を対象とした述語項構造と共参照関係のアノテーション:
NAISTテキストコーパス開発の経験から」
(200件中4件程度に与えられます)
教育
統計的自然言語処理の手法を中心に、講義と演習を担当しています。
担当講義・演習
- 奈良先端科学技術大学院大学情報科学研究科「先進情報科学」特別講義
「Advances in Statistical Methods for Natural Language Processing」
2011年12月-2012年1月.
(統計的自然言語処理の最新トピックについて講義しました)
- 奈良先端科学技術大学院大学情報科学研究科「プロジェクト実習I」演習
「頑健な自然言語処理のためのシステム開発と新技術の評価」.
2011年8月-2011年9月
(大規模なウェブデータを用いた頑健な単語分割と語義曖昧性解消、
そして述語項構造解析の研究の実習を行ないました)
- 奈良先端科学技術大学院大学情報科学研究科「プロジェクト実習I」演習
「GPGPU による自然言語処理」.
2010年8月-2010年9月
(GPU を用いて統計的機械翻訳の高速化を行なう実習をしました)
- 奈良先端科学技術大学院大学情報科学研究科「サマーブートキャンプ」演習
「統計的機械翻訳システムの構築」.
2010年8月
(学部生から社会人を相手に日英・英日の旅行会話翻訳システムを作る講義と演習
をしました)
- 東京電機大学理工学部「人工知能学プログラミング」特別講義
「自然言語処理研究の最前線 -- データが語ることばの意味」.
2010年6月
(かな漢字変換を題材に、統計的自然言語処理と人工知能における探索についてオムニバス講義しました)
- 近畿大学理工学部非常勤講師「情報メディアプロジェクトII」.
2008年9月-2009年3月
(対話システムの構築の講義と演習をしました)
論文審査委員
- 2011年度
- 修士: 岡照晃 (博士後期課程進学), 笠原誠司, 田尻俊宗, 常吉高弘, 鳥倉広大,
水本智也 (博士後期課程進学), Joseph Irwin (博士後期課程進学)
- 2010年度
- 修士: 雨宮尚範, 近藤修平 (博士後期課程進学), 林部祐太 (博士後期課程進学), 山崎義隆
学会活動
プログラム委員として国際会議の査読に関わったり、国内の論文誌の査読をする一方、各種シンポジウムやワークショップの企画運営をしています。
海外
- Conference on Empirical Methods in Natural Language Processing
and Natural Language Learning (EMNLP-CoNLL 2012) Program Committee
(2012)
- The 13th Conference of the European Chapter of the Association
for Computational Linguistics (EACL-2012) Program Committee (2012)
(ヨーロッパ最大の自然言語処理に関する国際会議です)
- International Joint Conference on Natural Language Processing (IJCNLP
2011) Program Committee (2011)
(アジア圏の最大の自然言語処理に関する国際会議です)
- Workshop on Advances in Text Input Methods (WTIM 2011) Program Committee
(2011)
(テキスト入力メソッドに関する世界初の国際ワークショップです)
- The Fifteenth Conference on Computational Natural Language Learning (CoNLL
2011) Program Committee (2011)
(自然言語理解や統計的自然言語処理では難関とされるメジャー会議の一つです)
- The Twenty-Fifth Conference on Artificial Intelligence (AAAI-11) Program
Committee (2011)
(人工知能で最難関とされるトップ国際会議の一つです)
- North American Chapter of the Association for Computational Linguistics -
Human Language Technologies Conference (NAACL-HLT) 2009 Program Committee
(自然言語処理で最難関とされるトップ会議会議の一つです)
国内
- NLP (自然言語処理) 若手の会シンポジウムプログラム委員 (2008, 2010-)
(2011年は NAIST のローカルオーガナイザーとしてシンポジウムを開催します。
2012年以降は共同委員長として若手の会を支え、若手活躍の場を広げていきます)
- 言語処理学会第18回年次大会 (NLP2012) テーマセッション
「文書の作成/校正支援」オーガナイザー (2012)
- 言語処理学会第17回年次大会 (NLP2011) ワークショップ
「自然言語処理における企業と大学と学生の関係」プログラム委員 (2011)
- 言語処理学会論文誌査読者 (2011)
- 情報処理学会論文誌査読者 (2010, 2011)
- 情報処理学会論文誌: データベース (TOD) 査読者 (2011, 2012)
- 電子情報通信学会論文 (D分冊) 査読者 (2009-2012)
- 人工知能学会論文誌査読者 (2010, 2012)
社会活動
- 2004年6月-
- Fink プロジェクト開発者
(Mac OS X のソフトウェア管理システム Fink
の公式開発者で、Mac OS X で簡単に Unix のツールが使えるようにサポート
していました。また、Apple WWDC Student Scholarship という奨学制度を
2006年と2009年に利用させてもらいました)
- 2003年7月-2007年10月
- Gentoo プロジェクト開発者
(Gentoo Linux の公式開発者でした。
メインで担当していたのは CJK、日中韓など英語以外の言語のソフトウェアで、
ソフトウェアの設定ファイルを書いたり、他の人に書いてもらったパッチを
取り込んだり、ソフトウェアの導入ポリシーについて本家で議論・交渉したり
していました)
雑誌記事
オープンソース開発活動で商業誌に定期的に寄稿していました。
- Software Design (技術評論社) 2004年 1月号: Gentoo
Linuxパッケージ作成ガイド【後編】
- Software Design (技術評論社) 2004年 2月号: Gentoo
Linuxパッケージ作成ガイド【後編】
- Software Design (技術評論社) 2004年12月号: Gentoo
Linuxパッケージ操作研究【前編】
- Software Design (技術評論社) 2005年 1月号: Gentoo
Linuxパッケージ操作研究【後編】
- Software Design (技術評論社) 2005年 3月号: Mac OS
XでPortageを使おう!〜Gentoo for Mac OS X、インストールから使用法まで
- Professional Mac OS X (ソフトバンクムック)「Mac OS X で始める UNIX
ライフ: パッケージングシステム総解説」
招待講演・セミナー等
Gentoo Linux
の本家公式開発者として招待講演をしていました。最近は産学連携や自然言語処理に
関する招待講演やパネル討論に招かれています。
- Microsoft Research Forum 2011 Panelist. "Study and Research Abroad". 2011年11月.
- 奈良先端未来開拓コロキウムパネリスト+司会. 「自然言語処理の最前線」
2011年9月.
-
株式会社ロックオン招待講演.
「自然言語処理とリサーチエンジニア」
2011年5月.
-
言語処理学会第17回年次大会ワークショップバネリスト+司会.
「自然言語処理における企業と大学と学生の関係」
2011年3月.
- 京都中ロータリークラブ例会招待講演.
「自然言語処理を応用した日本語学習支援」
2011年1月.
-
第3回楽天研究開発シンポジウムパネリスト.
「Open Data が切り開く新時代の研究・開発〜新たな産学連携の形を求めて〜」
2010年12月
-
2010年度第2回社会的知能発生学研究会招待講演.
「大規模コーパスを用いた計算言語類型論」.
2010年12月
- CAUAシンポジウム2010in大阪招待講演・パネリスト.
「ハッカーを育てる -- 人材育成のための大学の情報システム」.
2010年12月
- 東京大学辻井研究室招待講演
「Graph-Theoretic Approaches to Minimally Supervised Natural Language Learning」. 2010年6月
- 統計的機械翻訳勉強会(セミナー講師). 2010年3月
- Google TechTalk. スマートフォンにおける日本語入力の課題. 2010年3月
- WebDB Forum 2009 特別セッション「インターンシップと産学連携の可能性」パネリスト. 2009年11月
- Language Weaver 社: Graph-based Analysis of Semantic Drift in
Espresso-style Bootstrapping Algorithms. 2009年8月 (招待講演者)
- オープンソースカンファレンス2005 Gentoo Linux インストール大会
(セミナー講師)
- ソフトウェア技術者協会(SEA) & フリーソフトウェアイニシアティブ(FSIJ)
合同セミナー 2004 GentooJP 部会報告 (招待講演者)
- Internet Week 2003 OS Update (ライトニングトーク招待講演者)
その他の情報
- 語学:
- 英語 TOEIC 960 点、TOEFL CBT 266点 (2005/09)、TOEFL iBT 98点 (2009/03)
- シドニー大学に1年間留学、Microsoft Research
に3ヶ月、Apple Inc. に3ヶ月留学していました。
- 中国語
- 中学3年生から高校3年生まで、
第二外国語として選択していました。
- ドイツ語・フランス語
- 大学で第二外国語として英語の代わりに履修していました。
- プログラミング言語:
Python, C++, C#, Perl, Bash
- 開発プラットホーム:
Linux (Ubuntu), Mac OS X, Windows 7