研究テーマ
人間の知能の本質である自然言語の計算機による解析と理解を中心的なテーマとし,言語の構造の解明と定式化,また,その応用および関連研究を行なっている.
- 研究内容の概要
研究項目
自然言語の解析技術とその支援環境の構築および解析済みデータの蓄積
自然言語の解析に必要な解析済みのデータ、辞書、文法などの基本的な 言語データの構築、言語解析のためのツールの開発、および、そのた めの大規模テキストデータの検索・利用環境の構築を行っている。 さらに、辞書や解析済みの言語データを管理し、利用するための様々な 支援環境の整備を行っている。 文部科学省科学研究費特定研究「現代日本語書き言葉均衡コーパス」プロジェクト (代表者:国立国語研究所前川喜久雄)のツール班代表として日本語コーパス への種々の言語情報のアノテーションに関する研究を行っている。
- 公開ツールのページへ
統計的機械学習に基づく自然言語処理
近年大規模な言語データの入手が容易になってきており、それを解析したタグ 付きデータの蓄積も進んでいる。これらのデータを利用し、形態素解析、係り 受け解析、チャンキング、未知語の解析などの基本的な言語解析法へ統計的機 械学習法を適用する研究を行っている。同手法を多言語に適用し、日本語、英 語、中国語のツールと辞書の開発を行っている。
文献情報の自動抽出と参照関係に基づくリンク解析
オンラインで入手可能な科学論文数の増加にともない、研究者の間では、自身 の研究に関連する文献を効率よく検索する手法が待望されている。この要求に 答えるため、電子化論文に記載された参考文献の自動識別、および、参照関係 を元に文献・著者間の関係や論文の重要度を算出する手法を開発している。
深い言語理解に基づく機械翻訳
係り受け解析や意味解析を用いた統計的機械翻訳の研究をしている.
言語教育・言語学習支援
日本語を母語としない日本語学習者や,英語を母語としない英語学習者を対象に, 作文支援や自動誤り訂正,読解支援などの研究をしている.