概要
質問応答や対話に関する勉強会です。
学外の方の参加も歓迎します。
日時
- 時間: 木曜日, 13:30-
- 場所: A707
目次
2004年度
4/30 発表者:高橋
- S. Harabagiu, D. Moldovan, C. Clark, M. Bowden, J. Williams, J. Besley.
- Answer Mining by Combining Extraction Techniques with Abductive Reasoning.
- the 2003 edition of the Text REtrieval Conference (TREC)
TREC2003 QA trackで最も成績の良かったグループの working note。 特定のタイプの質問に対してIEの技術を取り入れている。
2003年度
11/19 発表者:松本(吉)
- Jennifer Chu-Carroll, Krzysztof Czuba, John Prager, and Abraham Ittycheriah.
- In Question Answering, Two Heads Are Better Than One.
- Proceedings of HLT-NAACL 2003 Main Papers, pp.24-31, May-June 2003
多くの質問応答システムではQuestion Analysis, Passage Retrieval, Answer Selectionを 一つのパイプラインで行なっている. 本論文では知識ベースのプロセスと統計ベースの プロセスを並行に動作させ、Question Analysis, Passage Retrieval, Answer Selectionの 各段階において、2つのプロセスの出力を比較、統合する手法を紹介している. この論文では、最終的に一つのプロセスを単独に動作させた場合よりもPrecisionで32.8%, 正当数で35.0%改善されたという結果を得ている.
11/13 発表者:高橋
- Stefanie Tellex, Boris Katz, Jimmy Lin, Gregory Marton, and Aaron Fernandes.
- Quantitative Evaluation of Passage Retrieval Algorithms for Question Answering.
- Proceedings of the 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR-2003),July 2003,
質問応答で用いる passage retrievalについて,いくつかの手法の 定量的な比較を行なっている.また,document retrievalと passage retrieval との関連についても議論している. この論文で得られた結果は、 1)IRでは BM25などの手法の方が精度がよいが,QAに用いるときには booleanによる IRの方がよい精度を出している. また,booleanでは passage retrievalのアルゴリズムによる違い が出にくい. 2)passage retrievalには density based approachがよい.
11/4 発表者:乾
- S. Singh, D. Litman, M. Kearns and M. Walker.
- Optimizing Dialogue Management with Reinforcement Learning: Experiments with the NJFun System.
- Artificial Intelligence Research, Vol. 16, pp. 105-133, 2002.
学習ベースの対話戦略選択の話を紹介します.対話における発話選択のシーケンスを マルコフ決定過程と見なして,これを対話コーパスに基づく強化学習によって最適化 するという話です.対話管理の論文はアーキテクチャの話が多いのですが,記述が 抽象的でわかりにくいのが多いので,今回は具体性を重視してこれを読むことに しました.
10/7 発表者:徳永
- A. Stolcke and K. Ries and N. Coccaro and E. Shriberg and R. Bates and D. Jurafsky and P. Taylor and R. Martin and C. Van Ess-Dykema and M. Meteer.
- Dialogue Act Modeling for Automatic Tagging and Recognition of Conversational Speech.
- A. Stolcke, K. Ries, N. Coccaro, E. Shriberg, R. Bates, D. Jurafsky, P.Taylor, R. Martin, C. Van Ess-Dykema, and M. Meteer, Dialogue Act Modeling for Automatic Tagging and Recognition of Conversational Speech, Computational Linguistics 26(3), 339--373, 2000.
本論文では,Speech Act Taggingの自動化に向けた有効な統計的手法を提案し, それをSpeech Recognitionに適応した結果について論じている. 具体的には,これまで研究されてきたようなDialogue Actを状態とした Hidden Markov Modelを使用したものに近い.ただ,状態を決定する素性として,人手で 転記した文字や音声認識器が判断した単語,そして音律,ピッチ,話者情報など 構文情報以外の素性をうまく組み合わせたモデルを構築している. また,これまでの研究に比べ19800発話という巨大な対話データを利用している.
9/12 発表者:高橋
- Annika Flycht-Eriksson and Arne Jonsson.
- Some empirical findings on dialogue management and domain ontologies in dialogue systems: Implications from an evaluation of BIRDQUEST.
- SIGDial2003.
この論文では前半で,開発した対話システム BirdQuestの説明をし ている.このシステムは対話のための知識源を,情報抽出の技術を 使って獲得しデータベースとして利用している.また,百科事典と, 質問文コーパスを用いてドメイン依存のオントロジーを作成し用い ている.後半では主にこのシステムの評価といくつかの問題点につ いての議論を行なっている.
5/13 発表者:乾
前回の続き
5/1 発表者:乾
- Jimmy Lin and Boris Katz
- Question Answering Techniques for the World Wide Web
- EACL2003, tutorial.
EACLのチュートリアルを紹介する. QAとWKAの両方を包含するような話.
2002年度
2/4 発表者:乾
- U. Helmjakob, A. Echibahi and D. Marcu.
- Natural language based reformulation resource and Web exploration for question answering.
- TREC-2002.
Reformulation(言い換え)を用いた質問応答. 言い換え規則は Ravichandran2002で獲得されたものを元に手作業で作成している. 知識源として,trecのドキュメントの他に webを用いた実験も行なっており, webに対して言い換えがよく働いたことが報告されている.
1/10 発表者:高橋
- Eugene Agichtein and Steve Lawrence and Luis Gravano
- Learning search engine specific query transformations for question answering
- World Wide Web 10,169-178",2001,
QAにおける IRを行なう際に,query expansionする規則を 質問文と答えの対から獲得するという話しです.
11/8 発表者:高橋
- Yutaka Sasaki, Hideki Isozaki, Tsutomu Hirao, Koji Kokuryou and Eisaku Maeda
- NTT's QA System for NTCIR QAC-1
- NTCIR Workshop 3 meeting QAC1
この論文では,Harabagiuらが行なっているように, logical formを作り,それらの unificationに基づき答を探しています.
10/18 発表者 : 乾
- Dekang Lin and Patrick Pantel.
- Discovery of inference rules for question answering.
- Natural Language Engineering, 7(4), 2001.
"X wrote Y"〜"X is the author of Y" "X manufactures Y"〜"X's Y factory" のような言い換え(inference rule)をコーパスから獲得し,QAに使うという 言い換えの獲得は,「文脈の分布の類似性」の基づいて類義語を獲得する Linの手法の拡張で,教師なし学習になっています.
9/13 発表者 : 高橋
- Moldovan, Dan and Pasca, Marius and Harabagiu, Sanda and Surdeanu, Mihai.
- Performance Issues and Error Analysis in an Open-Domain Question Answering System.
- Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL), pp 33-40, 2002
Titleにあるように,Error Analysisの話しですが,特に以下の 3点に注目しています. 1) serial baseline systemの各モジュールのパフォーマンス 2) feedbackと logical proverの効果 3) 使用する言語資源の効果
8/29 発表者 : 高橋
- Susan Dumais, Michele Banko Eric Brill, Jimmy Lin, Andrew Ng
- Web Questio Answering: Is More Always Better?
- SIGIR 2002
彼らは QAのアプローチとして,クエリーの言い換え(rewrite)を行なっています. 言い換え規則は手で作成。 質問タイプを 7つにわけて、それぞれのタイプ毎に 1〜5個の規則を用いる。
7/22 発表者 : 乾(ta)
- M.M.Soubbotin.
- Patterns of Potential Answer Expressions as Clues to the Right Answers.
- Proc. of the 2001 Text REtrieval Conference(TREC2001), 2001.
- Ravichandran, Deepak and Hovy, Eduard
- Learning surface text patterns for a Question Answering System
- Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL)},pp 41-47,2002
固有名詞のペアを使って,言い換え規則を自動的に獲得する.
7/8 発表者 : 高橋, 縄田
- A. Ittycheriah, M. Franz, S. Roukos.
- IBM's Statistical Question Answering System.
- TREC-10, page 258.
- H. Kazawa, H. Isozaki, E. Maeda.
- NTT Question Answering System.
- TREC 2001, page 415.
7/1 発表者 : 松本, 高村
- Sanda Harabagiu, Dan Moldvan, Marius Pasca, Steven Maiorano.
- The role of lexico-semantic feedback in open-domain textual question-answering.
- ACL-2001.
- Harabagiu,S., Moldovan,D., Pasca,M., Surdeanu,M., Mihalcea,R., Girju,R., Rus,V.,Lactusu,F., Morarescu,P. and Bunescu,R.
- Answering Complex, List and Context Questions with LCC's Question-Answering Server.
- the 2001 edition of the Text REtrieval Conference (TREC), 2001
6/24 発表者 : 乾
- Dekang Lin.
- Extracting Collocations from Text Corpora.
- Computerm '98, First Workshop on Computational Terminology *Proceedings of the Workshop, pp.57-63, 1998.
6/17 発表者 : 乾
- Dan Moldovan, Sanda Harabagiu, Marius Pasca, Rada Mihalcea, Richard Goodrum, Roxana Girju and Vasile Rus.
- LASSO: A Tool for Surfing the Answer Net.
- TREC-8, 1999.
- Sanda Harabagiu, Marius Pasca and Steven Maiorano,
- Experiments with Open-Domain Textual Question Answering.
- COLING-2000.