Dec 15, 2007

ganga

今日はmanab-kiくんと、以前から行こうと2人で話していたアジアカフェ Gangaへ。

店内の様子。エスニックな雰囲気が出ていてなおかつ統一感もあってよい感じ。

こちらはカウンター席。横には帽子やバッグ、雑貨などが置いてあり、販売もしている。

翌日にイベントがあるらしく、準備のため雑然としている。当日はここがステージになって、演奏がおこなわれるらしい。

メニューは、カレーに関してはチキンとエッグとベジタブルの3種類で、 カレー、サラダ、ライスで700円とお手ごろな値段 (ドリンク付きのセットは1000円)。 自分は今回、チキンを注文した。 カレーの味は、適度な辛さで結構あっさりしている。 癖になる人もいるかもしれないが、自分は アジャンタほどの常習性は無いかなと感じた。 ただ、ここの店のチャイは香りが良くスパイスが効いていてとても美味しい。

食事の後、上の写真の楽器に目がとまる。これはサーランギ(sarangi)という楽器でサーランギ自体はインドの民族楽器だそうだが、これは奥さんがネパールに行った時に、楽器売りの男の子が肩に下げていたものを、その時身につけていた時計と交換して手に入れたものだそうだ。打楽器のタブラとセットでよく使われたりする楽器で、シタールとは異なり、バイオリンのように弓を使って演奏する。

ネパールでの話を聞いた後、サーランギやタブラなどの楽器の話、有名な演奏者の話で奥さんと盛り上がった。一時期エスニック系の音楽に興味を持っていたことがあり、タブラなどの楽器の有名な奏者の名前は何人か知っていたのだが、奥さんのマニアックな知識にはついていけず・・・ こういう系統の音楽が好きな人、インドなどアジア方面の旅が好きな人は奥さんとの会話のネタが尽きないと思うので、ここはかなり楽しめる場所ではないだろうか。

IJCNLP2008に参加する方、もしサーランギを見つけたらお土産として買ってきてください;-)

Posted at 13:11 in misc | WriteBacks (7) | Edit

Dec 12, 2007

Comparisons of Sequence Labeling algorithms and Extensions

今日のDMLA勉強会ではmatsu先生が

  • Nam Nguyen and Yunsong Guo
  • Comparisons of Sequence Labeling Algorithms and Extensions
  • ICML 2007

を紹介。HMMs、CRFs[Lafferty 2001]、SVM multiclass[Crammer & Singer 2001]、SVM struct、M3N[Taskar 2003]、Perceptron[Collins 2002]、SEARN[Daume III 2006]といったSequence Labelingアルゴリズムの比較の話と、Ensemble学習の手法を提案したという内容。 実験でこれらの手法をPOS TaggingとOCRに適用しているのだが、POS Taggingの精度は以下のような結果に。

Ensemble > SVM struct > M3N > SVM multiclass > Perceptron > SEARN > CRFs > HMMs

CRFsがかなり悪いですねぇという話になったのだが、SVMsにCRFsが負けるというのはよく聞く話なので、納得できないことは無い。あと、M3N > CRFsはMax Margin的な最適化によってlog likelihoodに勝ったという感じだろうか。個人的には Perceptron > CRFsなのが少し気になった。

勉強会の中でCRFsで対数尤度最大化とは異なるパラメータの最適化手法があるという話を中途半端にしたのだが、それは[Koo 2007]で見かけたexponentiated-gradient (EG)[Bartlett 2004]のこと。[Koo 2007]は(log)linear modelでdependency parsingをやる話で、この論文では対数尤度最大化、Max Margin、Perceptronの3つの最適化手法を比較していてMax Marginが良かったと言っている。EGの論文はまだ深追いはしていないので、時間があったら読みます・・・

追記
こんな論文もありました。

  • Michael Collins, Amir Globerson, Terry Koo, Xavier Carreras, and Peter Bartlett.
  • Exponentiated Gradient Algorithms for Conditional Random Fields and Max-Margin Markov Networks.
  • Journal paper in submission.
Posted at 16:49 in research | WriteBacks (0) | Edit

Dec 10, 2007

CoNLL2008 Wiki

知らぬ間にCoNLL2008 Wikiができていた。

やはりDependency ParsingとSRLを一緒にやることになるようだ。SRLが入ったことで与えられたデータしか使ってはいけないClosed Challengeと、外部のリソースを使っても良いOpen Challengeの2つが設定されている。

trainingとdevelopment datasetの配布が3月10日、テストデータ配布が5月9日、結果を返すのは5月16日、paper submissionが5月30日というスケジュール。テストデータの配布が5月なのでまだ時間はある。どういうアプローチでいくか、ゆっくりと考えることにしよう。

Posted at 01:50 in research | WriteBacks (0) | Edit