ProjectPractice2004

日本語の読み推定のための規則性抽出と機械学習に基づく規則の実験的検証

担当者（講座名）：松本裕治，菅野亜紀，浅原正幸（自然言語処理学講座）
概要：例えば「貿易会社」の「会社」は（かいしゃ）ではなく（がいしゃ）「目覚し時計」の「時計」は（どけい）と読むように，同じ漢字でも読みが違う場合がある．本実習では，このような読みのゆれについて，文脈などを検討し規則性を探り，その評価実験を行う．
実施日程の概要：第II期（週１回）～夏期休暇（うち，計１週間）
使用する装置, ソフトウェアなど：Perl，Rubyなどの言語でデータ抽出を行う．
教科書, 参考書：特になし
受け入れ可能人数：3人
希望者が受け入れ可能人数を越えた場合の選択基準：課題への興味の強さとプログラミング能力
その他の特記事項：なし

課題提出締め切り　2004/08/31 までに {matsu,masayu-a} at is.naist.jp 宛にメールで送ること。
第５回ミーティング (2004/07/07/wed 11:00-12:00 A707)
- 配布したもの
  - 現代言語学入門２「日本語の音声」窪薗晴夫著 pp.107--147
  - パワーポイント資料
第４回ミーティング (2004/07/01 13:30-15:00 A707)
- 配布したもの
  - 「プロジェクト実習資料 2004/07/01」
  - パワーポイント資料
- 配布していないもの（参考）
  - 課題１の想定出力　　
  - Weka のチュートリアル　　
  - Weka のページ
第３回ミーティング (2004/06/24 15:10-15:55 A707)
- 配布したもの
  - 「プロジェクト実習資料 2004/06/24」
第２回ミーティング (2004/06/17 15:10-16:40 A707)
- 配布したもの
  - 「プロジェクト実習資料 2004/06/17」
  - Sufary ドキュメント　　
- 配布していないもの（参考）
  - 正規表現
  - サンプルプログラム集