ENGLISH    |  

Terascale Knowledge Acquisition 勉強会/2007年度

概要

Web文書など大規模データからの知識獲得に興味がある人向けの勉強会です。

日時

  • 時間: 木曜日19:00-
  • 場所: A707
  • 主な参加者:小町,牧本,飯田
    • 聞きに来る人: キャンベル,岩立,森田,水野,吉川,石橋

輪読

  • http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

    Web データの処理のために基礎知識をみんなでつける輪読。

    SICP勉強会と同じく、オンラインで無料で手に入るテキストを選択。本を買いたい人は買い(2008年発売予定)、そうでない人はオンラインで読むか印刷する。

    1回あたり1-2章読み進める。1章あたりスライド40枚=40分程度、2章で1時間半くらい見当。

    担当者はスライドを使って説明。参加者は事前に読んでくる必要はない。

    担当者は本文を読んでスライドに目を通す。スライドと本文が違う場合は補足説明する。スライドは PowerPoint のと LaTeX のとあるが、LaTeX バージョンを使う。

    標準準備時間は1章本文読むのに1時間、スライド見るのに10-20分。1.5時間以上準備にかけないでよいです。

    1時間半話して終わらなかったら残りは次回に持ち越し。

    2007年度内に終えることを目標。

    13章から18章までは、やらないかもしくは後回しにするかも。(別にこの勉強会でやらないでいいと思うので)

補足資料

日程

  • 第1週(10/18 mamoru-k)
    • 01 Information retrieval using the Boolean model
    • 02 The dictionary & postings lists
  • 第2週(10/25 mamoru-k)
    • 02 The dictionary & postings lists
    • 03 Tolerant retrieval
  • 第3週(11/1 shimpei-m)
    • 04 Index construction
    • 05 Index compression
  • 第4週(11/8 mamoru-k)
    • 06 Term weighting & vector space models
    • 07 Computing scores in a complete search system
  • 第5週(11/23 mamoru-k)
    • 08 Evaluation in information retrieval
    • 09 Relevance feedback & query expansion
    • 10 XML retrieval
  • 第6週(11/29 mamoru-k)
    • 11 Probabilistic information retrieval
    • 12 Language models for information retrieval
  • スキップ
    • 13 Text classification & Naive Bayes
    • 14 Vector space classification
    • 15 Support vector machines & kernel functions
    • 16 Flat clustering
    • 17 Hierarchical clustering
    • 18 Matrix decompositions & Latent Semantic Indexing
  • 第7週(12/6 mamoru-k)
    • 19 Web search basics I & Web search basics II
  • 第8週(12/12 ryu-i)
    • 20 Web crawling and indexes
    • 21 Link analysis