概要
Web文書など大規模データからの知識獲得に興味がある人向けの勉強会です。
日時
- 時間: 木曜日19:00-
- 場所: A707
- 主な参加者:小町,牧本,飯田
- 聞きに来る人: キャンベル,岩立,森田,水野,吉川,石橋
輪読
- http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html
Web データの処理のために基礎知識をみんなでつける輪読。
SICP勉強会と同じく、オンラインで無料で手に入るテキストを選択。
本を買いたい人は買い(2008年発売予定)、そうでない人はオンラインで読むか印刷する。1回あたり1-2章読み進める。1章あたりスライド40枚=40分程度、2章で1時間半くらい見当。
担当者はスライドを使って説明。参加者は事前に読んでくる必要はない。
担当者は本文を読んでスライドに目を通す。スライドと本文が違う場合は補足説明する。スライドは PowerPoint のと LaTeX のとあるが、LaTeX バージョンを使う。
標準準備時間は1章本文読むのに1時間、スライド見るのに10-20分。1.5時間以上準備にかけないでよいです。
1時間半話して終わらなかったら残りは次回に持ち越し。
2007年度内に終えることを目標。
13章から18章までは、やらないかもしくは後回しにするかも。(別にこの勉強会でやらないでいいと思うので)
補足資料
日程
- 第1週(10/18 mamoru-k)
- 01 Information retrieval using the Boolean model
- 02 The dictionary & postings lists
- 第2週(10/25 mamoru-k)
- 02 The dictionary & postings lists
- 03 Tolerant retrieval
- 第3週(11/1 shimpei-m)
- 04 Index construction
- 05 Index compression
- 第4週(11/8 mamoru-k)
- 06 Term weighting & vector space models
- 07 Computing scores in a complete search system
- 第5週(11/23 mamoru-k)
- 08 Evaluation in information retrieval
- 09 Relevance feedback & query expansion
- 10 XML retrieval
- 第6週(11/29 mamoru-k)
- 11 Probabilistic information retrieval
- 12 Language models for information retrieval
- スキップ
- 13 Text classification & Naive Bayes
- 14 Vector space classification
- 15 Support vector machines & kernel functions
- 16 Flat clustering
- 17 Hierarchical clustering
- 18 Matrix decompositions & Latent Semantic Indexing
- 第7週(12/6 mamoru-k)
- 19 Web search basics I & Web search basics II
- 第8週(12/12 ryu-i)
- 20 Web crawling and indexes
- 21 Link analysis