Dec 15, 2007
ganga
今日はmanab-kiくんと、以前から行こうと2人で話していたアジアカフェ Gangaへ。
店内の様子。エスニックな雰囲気が出ていてなおかつ統一感もあってよい感じ。
こちらはカウンター席。横には帽子やバッグ、雑貨などが置いてあり、販売もしている。
翌日にイベントがあるらしく、準備のため雑然としている。当日はここがステージになって、演奏がおこなわれるらしい。
メニューは、カレーに関してはチキンとエッグとベジタブルの3種類で、 カレー、サラダ、ライスで700円とお手ごろな値段 (ドリンク付きのセットは1000円)。 自分は今回、チキンを注文した。 カレーの味は、適度な辛さで結構あっさりしている。 癖になる人もいるかもしれないが、自分は アジャンタほどの常習性は無いかなと感じた。 ただ、ここの店のチャイは香りが良くスパイスが効いていてとても美味しい。
食事の後、上の写真の楽器に目がとまる。これはサーランギ(sarangi)という楽器でサーランギ自体はインドの民族楽器だそうだが、これは奥さんがネパールに行った時に、楽器売りの男の子が肩に下げていたものを、その時身につけていた時計と交換して手に入れたものだそうだ。打楽器のタブラとセットでよく使われたりする楽器で、シタールとは異なり、バイオリンのように弓を使って演奏する。
ネパールでの話を聞いた後、サーランギやタブラなどの楽器の話、有名な演奏者の話で奥さんと盛り上がった。一時期エスニック系の音楽に興味を持っていたことがあり、タブラなどの楽器の有名な奏者の名前は何人か知っていたのだが、奥さんのマニアックな知識にはついていけず・・・ こういう系統の音楽が好きな人、インドなどアジア方面の旅が好きな人は奥さんとの会話のネタが尽きないと思うので、ここはかなり楽しめる場所ではないだろうか。
IJCNLP2008に参加する方、もしサーランギを見つけたらお土産として買ってきてください;-)Dec 12, 2007
Comparisons of Sequence Labeling algorithms and Extensions
今日のDMLA勉強会ではmatsu先生が
- Nam Nguyen and Yunsong Guo
- Comparisons of Sequence Labeling Algorithms and Extensions
- ICML 2007
を紹介。HMMs、CRFs[Lafferty 2001]、SVM multiclass[Crammer & Singer 2001]、SVM struct、M3N[Taskar 2003]、Perceptron[Collins 2002]、SEARN[Daume III 2006]といったSequence Labelingアルゴリズムの比較の話と、Ensemble学習の手法を提案したという内容。 実験でこれらの手法をPOS TaggingとOCRに適用しているのだが、POS Taggingの精度は以下のような結果に。
Ensemble > SVM struct > M3N > SVM multiclass > Perceptron > SEARN > CRFs > HMMs
CRFsがかなり悪いですねぇという話になったのだが、SVMsにCRFsが負けるというのはよく聞く話なので、納得できないことは無い。あと、M3N > CRFsはMax Margin的な最適化によってlog likelihoodに勝ったという感じだろうか。個人的には Perceptron > CRFsなのが少し気になった。
勉強会の中でCRFsで対数尤度最大化とは異なるパラメータの最適化手法があるという話を中途半端にしたのだが、それは[Koo 2007]で見かけたexponentiated-gradient (EG)[Bartlett 2004]のこと。[Koo 2007]は(log)linear modelでdependency parsingをやる話で、この論文では対数尤度最大化、Max Margin、Perceptronの3つの最適化手法を比較していてMax Marginが良かったと言っている。EGの論文はまだ深追いはしていないので、時間があったら読みます・・・
追記
こんな論文もありました。
- Michael Collins, Amir Globerson, Terry Koo, Xavier Carreras, and Peter Bartlett.
- Exponentiated Gradient Algorithms for Conditional Random Fields and Max-Margin Markov Networks.
- Journal paper in submission.
Dec 10, 2007
CoNLL2008 Wiki
知らぬ間にCoNLL2008 Wikiができていた。
やはりDependency ParsingとSRLを一緒にやることになるようだ。SRLが入ったことで与えられたデータしか使ってはいけないClosed Challengeと、外部のリソースを使っても良いOpen Challengeの2つが設定されている。
trainingとdevelopment datasetの配布が3月10日、テストデータ配布が5月9日、結果を返すのは5月16日、paper submissionが5月30日というスケジュール。テストデータの配布が5月なのでまだ時間はある。どういうアプローチでいくか、ゆっくりと考えることにしよう。
Nov 27, 2007
CoNLL-2008
CoNLL-2008のページができていた。Coling2008のワークショップの期間に開催、Shared TaskはJoint Learning of Syntactic and Semantic Dependenciesとのこと。Joint Learningということで個人的にはかなり興味がある。Dependency ParsingとSRLを一緒にやるような感じだろうか?
Nov 26, 2007
自然言語処理n大学合同研究会 2007
22日、23日と自然言語処理合同研究会2007が開催された。
参加した大学、研究室についての詳細はshimpei-mくんの日記に詳しく書かれているのでそちらをどうぞ。
自分は2日目の午後に発表することになっていたのだが、発表当日の朝になって、事前に報告してあったタイトルとポスターのタイトルが違っているというありえないミスに気づきあわてて修正することに。ついでに喋り易いようにいくつか細かい修正をして改めてポスターを印刷。新しいバージョンはフォトプリント紙にしたので見栄えは良かったのではないかと思う。
発表前、異様に緊張してしまってどうしようかと思ったのだが、発表が始まって喋り始めるとだんだん落ち着いてきた。発表開始時からたくさんの人に聞きに来てもらうことができたので、結局1時間半の間ずっと喋りっぱなし。今回初めてのポスター発表だったのだが、ここまで大変だとは思わなかった。しかし、その中でたくさんの方から有益なコメントをいただくことができたので有難かった。ポスターはコミュニケーションを密にとれるので、oralよりも得られるものがいろいろとある。
追記:今回の発表で使用したポスターをこちらに置きました。
Nov 19, 2007
Advice on designing scientific posters
ポスターを作ることになったのだが、 作るのは今回が初めてなので何を注意すべきなのかがイマイチわからない。そこでいろいろと調べていたら以下のようなページを発見。
Purrington, C.B. 2006. Advice on designing scientific posters.
http://www.swarthmore.edu/NatSci/cpurrin1/posteradvice.htm.
レイアウトをどうするか、何を書くべきかに始まり、
- 1ブロック10文まで
- アンダーラインの代わりにイタリックを使う
- 画像は細い線で囲む
- 暗い背景色(+明るいフォントの色)は使うな
- ポスターと服の色が調和するようにする
Nov 18, 2007
daikichi@tsuruhashi / coo-ya
今日はmasahiko-h君と焼肉を食べに鶴橋へ。
鶴橋へはこの日初めて行ったのだが、さすが鶴橋、駅のホームから出口へ向かう途中から既に焼肉の香りが漂っていた。
駅を出ると、狭い路地に多くの焼肉店が軒を連ねている。
修論提出まで残り2ヶ月半、頑張ってくださいということで乾杯。
お肉の方はロースなど色々注文。柔らかくて美味しかった。
鶴橋ではビール一杯しか飲まなかったので、もう少し飲みましょうかという話になり、その後白庭台駅で降りて、そこから徒歩10分ぐらいのところにあるCOO-YAへ。ここは奈良に来てから時々顔を出している場所なのだが、6月下旬からしばらく奈良に居なかったので、半年振りぐらい。
店の雰囲気はこんな感じ。写真右側奥にDJブースがある。
いろいろと話しているうちに電車の時間が過ぎ、今日は歩いて帰ろうということになっていたのだが、それはあんまりお薦めしないということでマスターがNAISTまで送ってくれた。なんて優しいんだ…。
Nov 14, 2007
Learning as Search Optimization
11/9は、DMLA勉強会で以下の論文を紹介した。
- Hal Daume III and Daniel Marcu
- "Learning as Search Optimization: Approximate Large Margin Methods for Structured Prediction"
- International Conference on Machine Learning 2005
紹介した時点で理解不足なところがあったのでクリアにするという意味と、リクエストがあったのでまとめてみた。
Learning as Search Optimization (以下LaSO)というフレームワークの話で、これは構造予測のためのモデルの学習を、探索の最適化という観点で行なおうというもの。 最初は探索アルゴリズムの抽象的な話から始まり、そのアルゴリズムを学習に利用するために拡張するといった話の流れなのだが、主にRussellのArtificial Intelligence(日本語訳:エージェントアプローチ人工知能)の記述に従っているため、この本のサーチの部分を読んでおくと良いと思う。
LaSOの学習の流れを大雑把に説明すると(ここではsemi的なChunkingを例にとる)、以下のような学習データがあった場合、
[Great American]NP[said]VP[it]NP[increased]VP[its loan-loss reserves]NP[by]PP...長さとChunkの組合せとなるノード(length2でNPといったもの)を先頭から順番に探索していく。Viterbiをやっているような感じなのだけれど、これを探索という視点で考える。この場合は最初は空(もしくはBOS)で、次にlength2のNP(Great Americanに付与するChunkタグ)、次にlength1のVP(said)といったようにパスを辿っていく。どのパスを選択するかは、 w・Φ(x,y)といった一般的に用いられるfeatureとweightの内積によって求められるスコアを用いる。 探索を続けていき、探索途中で正しい答えが導けなくなる(具体的には、探索候補が展開されているqueueに正しい答えまでのパスを導けるノードが全く無い状況)か、または探索の最後で間違った場合(こちらはargmaxに相当するのだと思う)に学習をおこなう。 パーセプトロンの場合は基本的にargmaxを計算、つまりシーケンスの先頭から末尾までの全てに対するラベルを出力して、間違えたらパラメータを更新するが、LaSOの場合はシーケンスの頭からパスを探索していって、途中で正しい答えが導けなくなったらその時点でパラメータの更新を行ってしまという点が異なる。
パラメータの推定には2種類の方法を用いていて、一つはパーセプトロン、もう一つはALMA(Approximate Large Margin Algorithm)[Gentile 01]という近似的なMaxMargin学習アルゴリズムで、分離平面にマージンをとってなおかつパーセプトロンよりも学習が速いという特徴をもつ。(この論文で初めてこの話を知ったのだが、論文に書かれている実験結果を見ると、全体的にパーセプトロンよりも学習が速く、精度も高い。このALMAはかなり使えるのではないだろうか。)
LaSOの利点としては、
- POS-TaggingとChunkingのjoint estimationといったargmaxなどのexactな計算が困難なタスクにも適用可(LaSOのフレームワークではモデルの学習にargmaxの計算は不要だから)
- 学習及びdecodeが(beam-sizeにも依存するが)速い。(特に、POS-TaggingとChunkingのjoint estimationといったexactなinferenceが困難なケース。この問題で適用される手法としては例えばfactorial CRFs+TRP[Sutton 04]などがあるが、この手法と比較すると(論文には書いてないが、おそらく)かなり速い。)
疑問点:
- exactなinferenceが出来ない問題にも適用できますよということで、この論文ではPOS TaggingとChunkingのjoint estimationを行なっているが、これは複雑と言ってもlinear-chainを縦に2つ繋げただけで比較的マシな構造。論文を読む限り、POSとChunkタグを一緒にして一つのノード(e.g. DT&I-NP)としているように思える(はっきりと読み取れなかったため、もしかしたら違っているかもしれない)が、このようなノードの結合方法が自明でないような複雑さを持つ問題には具体的にどう適用するのか。
(説明不足な箇所があるので、もしかしたら書き直すかもしれません)
Nov 13, 2007
debut as net DJ
Pure.fmというTranceやHouseなどの主に4つ打ち系のクラブミュージックが放送されているネットラジオ局があるのだが、そこで自分のDJ Mixが日曜日(11日)に放送された。友人がこの局に番組を持っていて、Guestという形でMixを提供させてもらったのだが、自分のMixがネットで流れるというのは今回が初めてだったので、非常に良い経験になった。このような機会があるのは普通、イベントをオーガナイズしている人かその専属のDJの人、またはProducerといった経験豊富な人なので、自分のような自宅DJが参加させてもらっただけでも本当に有難い。なかなか時間が限られているので難しいのだけど、たまにはDJとしての活動もしていけたらと思う。
Support Cluster Machine
今日のDMLA勉強会では、hiraku-mくんが
- Bin Li, Mingmin Chi, Jianping Fan, Xiangyang Xue
- "Support Cluster Machine"
- International Conference on Machine Learning 2007
SVsをClusterという形で代表させて、Cluster上のKernelを定義してtest exampleの分類をおこなうという話。SVではなくSupport Clusters(SCs)にすることで、分類精度をそれほど落とすことなく、学習とテストを高速におこなうことができる。
問題点らしきところとしては、クラスタリングの性能に大きく依存してしまうところか。これは少し気になるところ。
Oct 10, 2007
Shift-Reduce Tagging for word segmentation, morphological analysis, NER, etc.
Shift-Reduce自体はParsingの手法として昔からある話なのだが、2007年に入ってからDyamaさんの固有表現抽出やO野原さんの形態素解析器など急に流行りだした。通常の系列taggingの手法(linear-chain CRFsやYamchaなど)では局所的な依存関係しか捉えられないし、かといってSemi的な考えを導入すると探索空間がむちゃくちゃ大きくなってしまって大変なのだが、Shift-ReduceではSemi的なfeature(辞書項目があるかどうかのbinaryまたはmarginal probabilityなどの実数値)を自然に入れられる上、計算量が抑えられるというメリットがあるので、これがスマートな方法なのかなという気がしてきた。
Oct 09, 2007
ECAI 2008, Conference Acceptance Ratio Statistics (AI, ML, etc.)
AI系の会議ではAAAIやIJCAIなどは知っていたが、ECAI(European Conference on Artificial Intelligence)という会議はノーマークだった。 来年のECAI2008は7月21日-25日にギリシャのパトラスで開催。Deadlineは2月25日でこれはACL2008とCOLING2008のDeadlineの間か。
あと、ECAIについて調べていたらConference Acceptance Ratio Statisticsというページを発見。
機械学習、データマイニング、人工知能などの会議の投稿数、採択数、採択率一覧が載っている。
NLP関連の会議についてはある程度把握しているのだが、その他の分野についてはあまり知る機会が無かったので、これだけ纏まった情報があるのは嬉しい。
ICML、NIPS、AAAIなどは近年ではだいたい20%台という感じだが、WWWが14.8%(2007年)と、意外と低くて驚いた。
可聴周波数域
可聴周波数域チェッカなるソフトがあるということを知り、自分がどの程度の可聴周波数域を持っているか計測してみることにした。
チェックに使用したヘッドフォンはSONYのMDR-7506。
結果は・・・17450Hz。
多分一般の人よりも大きな音量で普段音楽を聴いているので、自分の聴力にはあまり自信が無いのだけど、
20000Hzに全然届いていないのはショックだ・・・。
Sep 20, 2007
IJCNLP2008 accepted papers
IJCNLP2008のaccepted papersが出ていた。採択率は結構低かったらしいが、松本研の人は全員オーラルで通った。
この前のACL2007、EMNLP-CoNLL2007で発表した人の名前が結構入っているのだけど、自分は発表後からIJCNLP2008の締切までに結局殆ど研究を進めることはできていなかったので、スピードの違いを感じる。まっさらな状態から始めるか、前の仕事の延長でまとめるかなど、状況次第で成果が出るまでの時間は変わってくるだろうけれど、あの短期間で論文を書けるところまで持っていくのは厳しかった。
次の目標はACL2008ということになるだろう。締切はおそらく1月だろうから、残り約4ヶ月というところか。思ったほど時間は残されていない。
Sep 07, 2007
Sep 03, 2007
Aug 30, 2007
Aug 26, 2007
Aug 25, 2007
steak
takeuchiさんからのお誘いで、 5人でニュージャージー州のHobokenという場所(マンハッタン島の西側)にある Arthur's Tavernというステーキのお店に行く。
ここのステーキは大きさが半端じゃない。 普通サイズで一人前24oz(約680g)というありえないボリューム。 他の人は24ozステーキを注文していたが、ただでさえ普通の人よりも食べない自分がこの量を食べれるはずもなく、結局半分の12oz(これでも約340g)を注文。(ありえないのはこれに加えてダブル(48oz)という選択肢があること。こっちの人はどれだけ食うのだろうか。) あと、他の人がGuinnessの大ジョッキを注文していたので、自分も注文したのだが、大ジョッキのサイズは実は1Lであるということを後になって気づきへこむ。
先にGuinnessが来たので皆で乾杯。こっちのGuinessは嫌な苦味が無くて本当に美味しい。ただ、さすがに1Lは多かったけど・・・
その後ステーキが来る。肉の量はともかく、想像以上にポテトがどっさりと盛られてきて一瞬凍りついたが、味付けが良かったので意外と食べられた。ステーキの方も結構美味しくて、他の人が24ozステーキを完食する中、自分はヒイヒイ言いながら12ozをなんとか食べきった。もうしばらく肉はいいかな・・・
帰りに、マンハッタンの夜景を撮影。 夜景って撮るの難しいですね。もっと腕を上げねば。
Aug 09, 2007
chaotic
昨日、NYは洪水で地下鉄がストップ。こうなると残された移動手段は基本的にバスになるのだが、その時ちょうど出勤時間帯で大混雑。一応昼頃までは待ったが、復旧しそうになくいつになったら大学に行けるかわからないということで、結局諦めることに。駅近くのスタバでコーヒーを飲みながら少しだけコーディングしてそのままアパートに戻った。
それにしても、地下鉄がストップしたのはこちらに来てから3回目。2週間に一度ぐらいの頻度でストップしていることになるのだが、いくらなんでも頻繁に起こりすぎでは・・・
Aug 04, 2007
test20070804.mp3
test20070804.mp3
Trance。今までいくつか作ってきたが、その中で一番高揚感が出せたのではないかと思う。音数をもう少し足したいのだが、ノートPCの処理能力に限界があって今のところこんな感じに。
追記:改めて聴いてみるとかなり微妙なので削除。
Aug 03, 2007
Keihanna Summer Workshop 2007
けいはんな自然言語サマーワークショップ2007が昨日開催された。自分の発表もあったのだが、物理的に参加不可能だったのでmasayu-a助手に代理発表をお願いした。いろいろと有益なコメントをいただいたので、代理という形でも発表して良かったなぁと思う。ただ、やはりできれば自分で発表したかったし、他にも聞きたい発表がたくさんあった(発表が日本語というのも大きい)ので、今回参加できなかったのは本当に残念。
それにしても、今までNL研、人工知能学会全国大会に加えて今回のけいはんな自然言語サマーワークショップと日本語で発表する機会は3回あったのだが、その中で自分が喋ったのは一度だけだ・・・(NL研は******を患っていたため東京まで行けず、masayu-aさんに代理発表をお願いした。そして今回も。)
masayu-aさん、ご迷惑をおかけしております・・・
この話もこれで発表は一通り終わり、そろそろ次のネタに進みたいところだが、今は時間も限られているのでNYにいる間はこちらの仕事に専念するつもり。
Jul 30, 2007
The Sixth SIGHAN Workshop on Chinese Language Processing (SIGHAN6)
IJCNLP2008のmain conferenceのsubmission deadlineはもうそろそろだが、workshopのdeadlineは9月21日。今回のworkshopの一つであるThe Sixth SIGHAN Workshop on Chinese Language Processing (SIGHAN6)は中国語の言語処理に関するworkshopで、前々回のbakeoff(2005年)はChinese Word Segmentationタスクだった。自分は当時M1で、このタスクで初めて国際会議(IJCNLP2005 at Jeju, Korea)に参加したのだが、この時国際会議に参加したことで自分の進路が進学の方向へ向いていったので、とても思い出深い。
今回行なわれるタスクは3つで、Chinese Word Segmentation、Chinese Named Entity RecognitionとChinese POS-tagging。詳細については書かれていないようだが、Registrationしないと見れないのだろうか?
Jul 27, 2007
getting better from a cold
今回の風邪は胃腸へのダメージが大きく、熱が下がってからもしばらくろくに食事がとれなかった(食べると具合が悪くなる)のですが、9割方回復しました。まあ、今回の件でご飯の楽しみが無くなって研究に身が入るようになったので良かったのですが:-(
meeting
Sekine先生が日本から戻って来られたので、ミーティング。いろいろと調べているうちに、モデルを考える方向で腰を据えてじっくりとやりたい気持ちが出てきたのだが、先生の一番の興味と食い違うところがあることと、8月末までに成果を上げることが難しいということで、最初のミーティングで喋った方向で研究を進めていくことになった。まあその方が良いのかもしれない。多分モデルを考える方向で行ったら実験するところまでいかずにNY滞在が終わる。
Jul 22, 2007
cold
風邪ひいた・・・昨日Officeで2,3時間ほど寝てしまったのだが、起きてみると酷い寒気がして、体の節々が痛く頭痛もあったので、これはまずいと思ってとりあえずアパートに戻ることに。夜中は地下鉄を何度か乗り換えないと帰れないのだが、電車を待っている間に体調がどんどん悪くなってきて、それに耐えながらもなんとかアパートまで戻った。体温計が無いので体温が計れないのだが、多分37度後半~38度ぐらいはありそうな感じ。ああ、なんでこんなタイミングで・・・
Jul 19, 2007
Explosion in midtown Manhattan
今日のこっち時間の夕方頃、マンハッタンで爆発があった。テロとは関係ないらしい。今日は雨のせいで地下鉄が動いておらず(もう既に復旧している)、マンハッタンにはいなかったので無事です。
Jul 17, 2007
cigarette
こちらでタバコを吸っているとよく、「タバコくれない?」と声をかけられる。中には財布を取り出して「いくら?」と聞いてくる人も結構いる。日本ではこれはまずありえないが、こっちはタバコの値段が高いので一本を買うということは普通の感覚なのだろう。自分はタバコ1本で金を貰うのには違和感があるし、こういうコミュニケーションも今は楽しんでいるので、いくら?と言われてもいつも「お金は要らないよ」と言うのだけど。
Little India
ニューヨークのLittle Indiaと呼ばれる場所がQueensのJackson Hts駅周辺にある。
(あまりいい写真が撮れてなかったのでこれで)
昼食をとる店を探すためにその駅で降り、周辺をぶらぶらしていると、 インド人のオジサンが話しかけてきた。
「You are a lucky man!」
とか言ってきて名刺を差し出し、なんか説明を始めようとしている。
うーん・・・これは怪しいと思い、
「すみません。急いでいるので」
と言って逃げようとすると、しつこく
「one minute!」
と言って追いかけてくる。それでも無視して早足で移動したら、諦めたようで追いかけてこなくなった。何なんだ一体・・・親しげに話しかけてくるインド人には気をつけろ!
しばらく歩いて昼食をとる店を探していると、「KHANBABA BUFFET RESTAURANT」という店を発見。
Lunch Buffet $7.99 となかなか安かったので入ってみることにした。
「CHINESE & MUGHLAI BUFFET」と書いてある。
店内から。「PAKISTANI BANGLADESHI & INDIAN CUISINE」と書いてある。あれ、CHINESEは??
入ってみると、店内は結構静かで、田舎のレストランという感じ。
店員が無愛想で気に食わなかったが、カレーの選択肢の多さにその気分の悪さは一瞬にして消え去った。
写真はライスに加えて数種類のカレーを盛り付けたものと野菜の漬物。
ライスは何種類かあって、その中でこのライスを選択。色が緑やら赤やら華やかでおいしそうだなぁと思ったのだが、
これ実はかなり”甘い”。カレーとの相性は悪くないのだが、さすがにこの量の甘いライスを食べるのは辛かった。
カレーの味はなかなか良かったしリーズナブルな値段なので、
この店はNYにいる間に何度か来ることになるだろう。
Jul 14, 2007
Kenka
3人とも滞在中の研究計画を英語で喋るという一仕事を終え、 今日は飲みに行きましょうかという話になり、 aiharaくん、kobayashiくんと共に近くの日本人街の飲み屋「ケンカ」へ。
まずは入り口。看板が日本語。
入り口右側。なんというか・・・
店内の様子。店員さんは全員日本人だが、日本人の客は殆どいなかった。
店内の壁。やっぱりなんか違う・・・
メニュー。下には「ケンカの掟」と題していろいろと注意書きが。
壁に貼ってあるメニュー。日本語、しかも日本円で書かれている。
「大衆と共に永久に栄えよ」
ここはビールがジョッキ1杯$1.5で飲めるのでかなり安い。枝豆や鳥の唐揚げ、揚げだし豆腐なども食べることができる。 結局3人で飲み食いして一人あたり$23ぐらいだったのでかなりお得ではあるが、また来たいとは思わなかった。
Jul 13, 2007
chill
アパートから大学までdoor to doorで1時間弱かかるのだが、昨日はその時間が勿体無くてOfficeで寝た。部屋が寒かったせいか、どうも悪寒がする。今日は大人しく帰ることにしよう。。。
Talk of the EMNLP paper and research plan@NYU
Ralph Grishman先生、Sekine先生、NYUのNLPグループのメンバーを前に、EMNLPの話とNYU滞在期間の研究計画について話す。EMNLPの話の方はまあチェコでの発表時の反応と同じような感じだった。研究計画についてはもう少し練る必要がありそう。
タスクとしては、もう既に書かれてしまっているのでここにも書くが、辞書を使ったNamed Entity Recognition(NER)ということになりそう。NER自体はだいぶ下火になっていると思うので、External Knowledgeの使い方で攻めるか、Semi-Supervised、Unsupervisedで攻めるか、モデルで攻めるかというところだろうか。
今年度頭からEMNLPの発表まではアウトプット期間だったため満足に調べ物ができなかったのだが、ようやくここに来てできるようになったという感じ。やっぱりサーベイは楽しい。
Jul 12, 2007
The 2nd NLP Symposium for Young Researchers
NLP若手の会第2回シンポジウムは8月15日に発表申し込み締切、9月21日に論文提出締切。8月15日ってあと1ヶ月ちょっとしかないなぁ。この時期に結果が出る見通しがたっている or preliminary resultsが出てる状況で面白い話ができそうだったら申し込んでみたいが、かなり厳しそうだ・・・
ICML, UAI and COLT 2008
2008年のICML、UAI、COLTはフィンランドのヘルシンキで7月に開催。これらの会議に論文が通ることはまず無いだろうけど、北欧には一度は行ってみたいので(って最近行ってみたいというのが多いけど)、参加だけするとかできないかなぁ。
Curries in NY
私はカレーを定期的に食べないと生きていけない人種なので、 こちらに来てからも美味しいカレーを食べられる場所をいろいろと探している。
NYに来て最初に行ったのは、大学から歩いて10分ぐらいのところにあるインド料理のお店cafe spice。cafe spiceの文字がdevanagari風になっている。
店内は結構カジュアルな感じのお店で、Bistroと書いてあるようにお酒も飲める。
インドの人らしき店員さんにいろいろと聞いた結果、南インドでよく食べられているドーサを注文。
皿からはみ出して乗っているのがドーサ。これはカリッとしていて、ちょっと酸味がある。写真ではわからないが、この中にひき肉や野菜などが入っている。
右下の赤と白のものが(多分)チャトニ。赤い方は(多分)トマトのチャトニで、酸味がある。白い方はココナッツミルクのチャトニ。甘さはそれほどなく、不思議な味。南インドでは葉っぱの上にご飯やらカレーやらが乗って出てくる(らしい)ので、その雰囲気が出ている。カレーの味は、さらっとしているけれどもその中に深みがあって、かなり美味しい。ここは毎日通ってもいいなぁと思えるところ。今後もお世話になりそう。
次は、アパートの近くにある店にあるショッピングモール内のフードコートにあるタイ料理の店のカレー。
riceかnoodleかをまず選び、次に2品選ぶ。残念ながらカレーは一種類(Curry Chicken)しかなかったのでそれと野菜炒めを選択。
ドリンクは別で$6ぐらい。チキンはこんなにいらないのだが・・・。まあこっちの食事の中では悪くはないが決して良くは無い。写真を載せるほどではないけど、こっちで食べたカレーということで一応載せた。
次に行ったのは、ベトナム料理のお店。ランチは$6ぐらいで、+50セントでドリンクがつく。結構安め。
メニューを眺めていると、Curry Chickenというのを発見したので迷うことなく注文。
何の調味料かわからなかったが、独特の香りがして、今までに食べたことの無い感じのカレー。それほど期待してなかったのだがこれは癖になりそうな味。キャベツなどの野菜は甘酸っぱく味付けがされていて、カレーとの相性は抜群。ランチは手ごろな値段なので、また来ることになるだろう。
昨日は2回目のcafe spice。今度はディナーの時間に行ったのだが、店内はちょっと暗めに照明が抑えられていて良い感じの雰囲気で、デートなんかには結構使えそう(ここでそんな場所見つけても仕方ないが・・・)。その雰囲気に負けてカレーに加えてmaharajaというビールを注文、さらにspecialなappetizerがあるんだけどどう?と薦められ、noと言えずにそれも注文してしまった。
これがスペシャルだと言っていたchickenのappetizer。
アメリカに来てからもう嫌というほどchickenという単語を見ているので、
chickenに対してあまり良いイメージが無くなってしまっていたのだが、
これはむちゃくちゃ美味しい。
スパイスの良い風味が口全体に広がり、なおかつ左上の緑色のソースが
これまた独特の香りなのだが、チキンの味に調和して絶妙な味に。
その後に、注文したgoan fish curryが登場。(写真がぼけてしまった)
カレーは、fish curryに加えてひよこ豆のカレーがついてきた。
fish curryの方は、味付けは控えめながらも、インド特有の細長い米と絡めて食べると絶妙な味わい。
ひよこ豆の方も見かけによらず、ちゃんとスパイスが効いていてこちらもかなり美味しい。
ライスが少ないように見えるが、その分結構な量のカレーがあるので、充分胃は満たされる。
マンハッタンにはインド人街があって、そこにはインド料理屋がたくさんあるらしい。今度暇を見つけて行ってくることにします。
Jul 08, 2007
EMNLP-CoNLL2007@Prague, Czech (2日目:発表)
諸事情により何日か空いてます。(何日目とか書くと毎日更新しないといけないような気になってしまう)
今日は発表の日。昨日は、こっちに来てからいつも飲んでいたビールを控え、 ご飯も会場に置いてあったサンドイッチで済ませて準備をしていた。 喋りにくい箇所をちょこちょこ変更していたため、全体を通して喋る練習は 昨日の夜に一回と、今朝一回の計2回しか練習できていないまま壇上に立つことに。 chairのHalはnatural language processing blogで有名な人。
最初の発表者が発表を終え、自分が壇上に立つ。 chairから紹介され、自分のtalkが始まる。 話し始めて、意外と緊張していないことに気づく。 数箇所、なかなか言葉が出てこないところがあったものの、 全体を通して、滞りなく喋ることができたし、ほぼ満足のいく発表ができた。
さて、問題の質疑応答。 chairが質問があるかどうか会場に聞く。・・・・・・反応なし。 仕方ないので・・・という感じでchairが質問をしてくる。最初、聞き取れずもう一度言ってもらったら理解できた。 回答も、搾り出した回答で納得してもらえ、最悪の事態だけは逃れた。 この質問一つだけで質疑は終了。質問されても今の英語力ではまともな返答はできないし、それを会場の人もわかっていたのだろう。
初めての国際会議発表、まあともかく無事終わって良かった。 ただ、英語が不自由なのはなんとももどかしい。これは何とかしたいものだなぁ。
Kenneth Cole
アパートから歩いて10分ぐらいのところにあるMacy'sをぶらぶらしていると、香水を売っているお店を発見。最近はサボってあまりつけなくなってしまっていたが、プラハの人々が結構香水をつけていたので、それに影響を受けてまたつけようかなぁと思っていたところだった。
テスターが全て棚の中に入っていて、自分では香りを確認することができなかったため、品揃えをじーっと見ていたら、店員さんが声をかけてきた。softかhardどちらがいいかを聞かれたのでsoftだと言ったところ、3種類ほど紹介してくれた。その中で買ったのはKenneth ColeというNYのブランドのもの。爽やかかつ少しwoodyな香りがとても気に入ったのですぐに購入した。見たことがなかったので調べてみたところ、まだ日本には入ってきてないブランドらしい。日本での入手は少し面倒くさそうだが、他の人と被らないことの方が重要なので、しばらくはこれをつけることになるかな。
Jul 07, 2007
ID Card
我々のOfficeはビルの7階にあるのだが、1階にはいつも守衛さんがいて、IDを見せないと入れてもらえない。 初日にIDを作る予定だったのだが、何と担当者が来週の月曜日まで休みということでIDが作れないという困った状況になっている。 IDが無い場合は1階で名前を書いて、パスポートを見せれば入れる(はず)なのだが、今朝行ってみたら名前を書く書類が置いてなかったのでパスポートを見せて入ろうとしたら、許可が無いと入れることはできないとのこと。aihara君に先生がいるかどうか確認してもらったが、不幸にも不在だった。
yotaro:「昨日この書類に名前を書いて、パスポートを見せたら入れてもらえたんですけど・・・」
守衛さん:「そうかもしれんけど、お前を入れていいかどうか書類が無いし、確認も取れないんだから入れるわけにはいかねぇよ!!」
(ああ、勘弁してくれよ・・・なんで自分だけこんな目に・・・) 結局先生とは連絡が取れず、自分だけ入れてもらえなかった(他の二人は既にIDをもらっているため問題なく入れる) どうしましょうかという話になったが、2人それぞれ仕事を抱えているだろうから、Officeに行ってくださいと言い残し、 自分は独り、近くの公園でタバコを吸いながら昨日印刷した論文を読んで時間を潰す。
昼頃もう一度Officeの入っているビルに行ってみると、守衛さんの態度が一転していて、 「ワタナベさんですね?これから確認をとりますので」といって連絡してもらって、確認が取れたということですんなり許可が下りた。 論文読みが捗ったからまあいいけど、こういうのは本当に勘弁してほしいよなぁ。
Jul 06, 2007
Jul 05, 2007
NY到着
伊丹→羽田→成田→J.F.Kというちょっとおかしなルートを経由して無事NYに到着。こちらもそこそこ暑いのだけれど、奈良よりはマシだと思う。
チェコから帰国して二日後の朝に移動というスケジュールだったため結構疲れが・・・。ちょっと休みたいなぁ・・・。
Jul 02, 2007
ACL2007@Prague, Czech (初日)
6/21 (大会2日目)
今日は自分の発表。5月のNL研は参加できなかったため、実は今回が初めての会議発表でした。発表自体はとくに問題なく終了。ただ、自分は質疑応答があまり得意ではないようです・・・
お昼はmasayu-a助手とyuchanと僕でイオン宮崎ショッピングセンターまで行って食事。これからしばらく和食は食べられないだろうということで和食のお店へ。ここのイオンには3日で計4回も食事でお世話になりました。もしここが無かったらまともに食事にありつけなかったと思います・・・
午後はyuu-tくんと合流してお喋り。会議で一緒になるなんてもう無いだろうねなんて話をしたりしてたらあっという間に空港行きのバスの時間がきたので、17時20分発の飛行機で伊丹まで戻る。明日朝早い時間に発つので、奈良まで戻らずに梅田で一泊します。
6/20 (大会1日目)
会場近くのシェラトン・グランデ・オーシャンリゾート42階から撮影した写真です。

写真とって遊んでいただけではなくて、発表もちゃんと聞きに行きましたよ。東大のDanushkaさんが、Webで共起と、検索結果に出てくるsnippetからパターンを抽出して、それらを組み合わせて2単語間のSemantic Similarityをはかるという話をしてました。双方をSVMsのfeatureとして使って、sigmoid functionで確率にするという感じ。この手の話はまだまだ出てきそうですねぇ。
6/19 (大会前日)
宮崎に到着しました。フライト時間は実質1時間ぐらいだったのであっという間。空港から出ると、まず目に入ったのが椰子の木。この美しい光景は、南国に来た気分にさせてくれます。下の写真の奥に見えるのが宮崎空港。

シーガイアリゾートの方はというと、予算のせいなのかもしれませんが、施設のメンテナンスが行き届いていない印象。案内の看板がぼろぼろになっていたり、施設の外壁の汚れが結構酷い。また、ホテルの周辺にコンビニなどは無く、買い物はイオン宮崎ショッピングセンターまでシャトルバスが出ているので、それを利用したのですが、片道25分ぐらい。かなり不便と言わざるを得ないですね。「陸の孤島」と呼ばれる理由が分かった気がします・・・
夜は宮崎の地ビール、ひでじビールで晩酌。ピルスナーのきつねはすっきりとしていて飲みやすかったです。
6/18
第21回人工知能学会全国大会参加のため明日から宮崎に行ってきます。会場はフェニックスシーガイアリゾート。ホテルの部屋からはオーシャンビューが見られるようなので、絶景を眺めつつお酒でも飲みたいところですが、発表準備がまだ終わってないのでそれどころではなさそうです・・・。
ACL2007@Prague, Czech (初日)
今日は特に予定がなかったため、午前中にある程度予定を立てて、 午後からプラハ中心地へ。
チェコでは、バス・地下鉄・路上電車などで使える共通のフリーパスがあり、それを購入することでどれでも乗ることができる。今回は滞在が9日ぐらいになるので、15日分のフリーパス券を地下鉄の駅近くの売店で購入。 これを使うと、改札は最初の一度だけ行なえばよく、あとは期限が切れるまではこれを持っているだけでよい。
地下鉄の駅はこんな感じ。

購入したフリーパス券でChodov駅から中心地まで行くためにMuzeum駅まで行く。電車内のアナウンスはチェコ語オンリーだが、電車内に次の駅の表示があるためそれほど苦労はしない。
まもなくMuzeum駅に到着。駅を出てまず目に入ってくるのは国立博物館。

国立博物館から撮影した駅周辺の様子。

こちらは路上電車。
次に向かったのはプラハ中央駅の駅舎。

この辺りは治安があまりよろしくない。怪しげな人何人かに声をかけられたが、適当にあしらって回避した。
途中で雨が降ってきたので、その間に昼食をとるために店探すことに。
いろいろと探した結果、中華料理の屋台を見つけたのでそこで食事。

料理ができるまでお店の中国人の女性と会話。旅行ではこういう会話が本当に楽しい。
注文した料理は、鶏肉と野菜をちょっと辛く炒めたものにご飯がついて
59Kc.+持ち帰り用の容器5cz.=64Kc.(370円ぐらい)となかなかリーズナブルな値段。
食事後、ドヴォジャーク博物館に行くために移動。
地図を見ながら探していたのだが、場所がどうしても分からず、何度も同じ場所をうろうろしているうちに足が限界に近づいてきたためやむなく諦めることに。ああ、こんな靴で来るんじゃなかった。

左がドヴォジャーク博物館への案内標識。
一旦ホテルに戻り、少し休息をとった後、ホテルから歩いて20分ぐらいのところにある
ショッピングセンターCENTRUM CHODOVに行って夕食をとることに。

折角チェコまで来たのだから、ビールは欠かせないだろうということで、飲めそうなところを探し、結局ショッピングセンター内のBarで食事。パスタ(127Kc.)とstaroprament granatというビール(27Kc.)を注文。チェコでは一般的なのかもしれないが、だいたい150円ぐらいでビールが一杯飲めるので安い。

移動で疲れがだいぶたまっていたので、バスで戻ってすぐに就寝した。
Jun 30, 2007
LREC2008, EACL2009
LREC2008はモロッコ(!)のマラケシュで2008年の5月28~30日に、EACL2009はギリシャのアテネで2009年の3月30日~4月3日に開催されるらしい。双方共に惹かれるけれど、特にギリシャは一度は行ってみたい場所なので、タイミングが合えば何か出したいなぁ。
ACL2007@Prague, Czech (3日目:観光)
前回、国立博物館周辺しか観光できなかったため、 今日はyuchanと一緒にプラハ城へ行く。 Chodov駅からMuzseum駅で乗り換え、Malostranska駅で下車。 駅を降りるとそこにはプラハらしい景観が。
プラハ城に向かって移動。向かう途中、こんな階段を登ったり。

階段を登ると、そこにはプラハ城の入り口のあるフラッチャニ広場がある。平日にもかかわらず、観光客でいっぱい。

プラハ城入り口の門をくぐるとまず目に入るのが広場の中にある噴水。
この広場にはチケット売り場や土産物屋などがある。
中庭から門をくぐって抜けると、そこにそびえ立つのが聖ヴィート大聖堂。あまりの美しさに感動。
聖ヴィート大聖堂をカメラで撮影していると、4人組の女の子の集団のうちの一人が、僕の方向にカメラを向けて撮影しながらクスクス笑っているのに気づいた。最初、僕の後ろにある何かを撮っているのだろうと思っていたが、僕が移動すると、それに伴って彼女のカメラの向きも移動。どうやらターゲットは僕だったらしい。思い切って彼女たちの方に近づいていくと、「コンニチワー」と日本語で挨拶してくれた。 僕も照れながら、「こんにちは~」と日本語で挨拶。 その後彼女たちは別の場所に向かい、 自分は聖ヴィート大聖堂の写真を違うアングルから撮影していたのだが、しばらくしてまた彼女たちが自分の方に近づいてきて、 「もしよろしければ一緒に写真を撮ってくれませんか?」と言ってきた。想定外の状況にかなり動揺しつつも、「いいですよ」と言って一緒に写真をとることにした。yuchanにお願いしてこのとき写真を撮ってもらったのだが、カメラで最初僕を撮っていて、後で「一緒に写真を撮って下さい」と声をかけてくれた女の子だけ撮った写真に入っていなかったことと、彼女たちの名前や出身地など聞くのを忘れてしまったことが本当に悔やまれる。おそらく今回のプラハ旅行でこれが一番の後悔となるだろう。
次に向かったのが聖イジー教会。この中では最も古い教会で、
音響が良いということで音楽ホールとして現在よく使われているらしい。
プラハ城を出ると、なにやら門付近に人だかりができていた。
その時ちょうど正午12時で、衛兵交代のセレモニーが行なわれているところだった。音楽隊の生演奏があり、かなり大規模な交代式。
プラハ城を後にし、カレル橋に向かう途中の道から眺めるプラハ市街。
お昼を過ぎていたので、たまたま通りかかったお店で食事をとることに。ビールの誘惑に勝てず、食べ物と一緒に昼間にもかかわらずビールを注文。食べ物の方は、パンにお肉や野菜などが一皿に盛り付けられているもので250Kc.ぐらいとちょっと高め。まあ場所が場所だけに仕方ないのだろう。
味はまずまずというところだったが、やはり量が多くて食べきることはできなかった。
食事の後、カレル橋に向かって移動。
しばらく歩いていると、すぐにカレル橋が見えてきた。写真はカレル橋西側の門。

カレル橋はヨーロッパに現存する最古の石橋で、完成は1400年。
ここも観光客で溢れている。

ここを抜けるとプラハ旧市街に入る。カレル橋を渡ってブルタヴァ川沿いの道をちょっと進んだところから眺めるカレル橋とプラハ城の絶景。
カレル橋を抜けて旧市街側に入ると、そこは土産物屋やレストランなどのお店が軒を連ねている。

途中土産物屋に入り、プラハの風景画のマグネットを買い、
別の店で、良い香りのする手作りの石鹸をいくつか購入。
商店街を抜けると、旧市街広場が見えてくる。
そこにあるのが旧市庁舎。

そこからツェレトゥナー通りを歩いていくと見えてくるのが火薬塔。
1754年まで城の火薬庫として使われていたらしい。

実は後になって知ったのだが、プラハ城から火薬塔まで我々が通ってきた道は、
4世紀にわたって歴代の王がパレードを行なってきた道ということで王の道と呼ばれているらしい。
プラハを一通り観光をしたところで疲労もかなりたまっていたので、 Mustek駅に向かい、そこからMuzeum駅で乗り換えてChodov駅まで戻ってそのままホテルへ。
Jun 28, 2007
ACL2007@Prague, Czech (2日目)
今日はWelcome PartyがあってACL参加者は全員出席できるということで出席。Registration時にチケットが2枚配られ、2杯までは好きな飲み物が飲めるようになっている。開始後しばらくして、aramakiさんとタバコのタイミングが一致したので、一緒にタバコを吸いながら雑談。
Welcome Partyでは食事があまりできなかったため、その後11人でCENTRUM CHODOVで食事。チェコはビールは美味しいけれど、食べものはなんとも言えないかな。結構な量出てくるので、シェアしてちょうど良いぐらい。
Jun 27, 2007
ACL2008, ACL-IJCNLP2009
来年のACL2008はオハイオ州のコロンバス、その翌年のACL-IJCNLP2009はシンガポールで開催されるらしい。ACL-IJCNLP2009の頃は自分はもうD3。それまでの研究活動の集大成をここで発表できればいいなぁ。
Jun 24, 2007
関空→フランクフルト(ドイツ)→プラハ(チェコ)
今日(22日)は移動日。前日宮崎から帰ってきたばかりなので、まだちょっと体がしんどい・・・。 一日休みを挟むべきだったと後悔しつつも、梅田発のリムジンバスで関空に向けて出発。 関空には1時間ほどしてすぐに到着。今回利用するドイツの航空会社Lufthansaの受付に行くと、 Delayが発生していて当初9時55分発だったはずが、13時30分発ということに。 ああ、波乱の予感。お詫びということで1000円分の食事券をいただく。 確かにこういう場合、どう時間を潰すかは悩みどころだが、こういう気遣いがあるとは知らなかった。
もらった食事券で食事をした後、搭乗1時間前ぐらいになってからkazuo-hさんと合流。 搭乗まで時間があったので、coordinationの話をいろいろと聞いた。
しばらくして搭乗、そして離陸。一路フランクフルト(ドイツ)へ。 飛行機の中で自分の隣の座席になったのは、ハンガリー人の男性。年齢は50歳前後というところ。 もともと自分が通路側、ハンガリー人の男性が窓側だったのだが、 「窓側と通路側、どちらがよろしいですか?あなたにお任せしますよ」 と言ってくれたので、窓側に座らせてもらった。ああ、なんていい人なんだ。 この方、京都に5日ほど滞在して、フランクフルト経由でハンガリーに帰るところだったようです。
十数時間ほど経った後、ようやくフランクフルトに到着。 到着がDelayで4時間ほど遅れたため、乗り継ぎのフライトの変更手続きをする。 結果、22時5分発プラハ行きの飛行機に乗ることに。 現在日本とチェコでは7時間(サマータイム込)時差があるのでこの頃、日本時間では朝の5時ぐらい。 疲労もピークに達し、早くホテルに行きたいですねと2人で話しながら、実はチェコについてからが問題なんですよねという話に。 フランクフルトからチェコまでは1時間強程度なのだが、それから移動して自分の荷物を受け取ると、 0時近くになってしまう。バスまたは地下鉄がその時間まで動いているかというとかなり怪しい。 ちゃんと着けるかどうかかなり不安になりつつも、2時間ほどの待ち時間の間、 売店で買ったドイツビールで不安な気持ちを紛らわした。
しばらくして搭乗、プラハ(チェコ)へ向かう。 疲労が蓄積していたため、ところどころ寝てしまったので、プラハにはあっという間に着いた。 入国はスムーズに終わったが、Baggage Claimから自分の荷物が出てくるのにだいぶ時間がかかってしまって、 気づいたら日付が変わっていた。バスがもう既に無くなっていて、 もうタクシーしか無いという状況だったのだが、ここのタクシーは旅行者に対してふっかけてくるケースが多々あるということを 知っていたため、どうしたものかと困っていた。 そこで、kazuo-hさんが、ACL参加者でTOPHotelに向かおうとしている人を探してくれて、 その人たちとminibusに乗り合わせてなんとかTOPHotelまで到着。
Hotelの中に入ってみると、時間帯のせいもあっただろうが、なんか薄暗い・・・し雰囲気もよくない。 kazuo-hさんとは隣接するガルニホテルに泊まるということでここでお別れ。 部屋に入り、早速無線LANが繋がるかどうかを確認してみると、利用できるネットワークが無い・・・ 早速フロントに電話してみたが、「わからんから他で聞いてくれ」とたらいまわしにされた挙句、 「部屋では無理です。フロント周辺であれば繋げます」との返事。 ホテルのHPには Rooms of higher standard are equipped with an individually controlled partly air conditioning and internet connection. と書いてある。自分の部屋はstandard roomなのだが、rooms of higher standardには入っていなかったようだ。
外の音が結構聞こえるなぁと気になりつつ、疲労が溜まっていたためすぐにベッドで寝ようとしたところ、 近くの部屋から大合唱が始まる。勘弁してくれ・・・
Jun 16, 2007
Global COE Program
平成19年度グローバルCOEプログラム審査結果が昨日(15日)ようやく発表された。
NAISTは情報・物質・バイオそれぞれ申請していたが、採択されたのはバイオだけ。
採択件数が減ったというのが大きいとは思うけれども、なかなか厳しいですな・・・
Jun 13, 2007
Com Ngon
近鉄奈良駅近くのベトナム料理のお店Com Ngon(コム・ゴン)に行ってきました。
店内の雰囲気は結構良くて、テーブルや、椅子、下の写真を見てもらうとわかりますが、器を乗せるトレー(?)も凝った作り。
今日食べたのはフォーランチ。フォーのスープを飲むと微かにシナモンのような香りがしてびっくりしましたが、こういうのもアリなんですね。
全体の印象として、味は好みもあると思いますが、個人的にはまあまあかなと。頻繁に行きたいと思うほどではなかったです。
Jun 12, 2007
アウトプット
固有表現抽出の分野で有名な方から、僕の修士論文に関する質問をメールでいただいた。
D1になってから自分のページを作ったのだが、こうして質問をいただくと、
ああ、自分もアウトプットし始めているのだなと実感できる。
質問の中には、指摘を受けて初めて気づいたこともあって、とてもためになった。
自分のページを作って論文を公開することでより多くの人に見てもらえるし、
読んでくれた人の中にはコメントをくれる人もいるかもしれない。
場合によっては今後の研究の方向性を左右しうる指摘を受けることもあるかもしれないから、
自分の仕事を積極的にアウトプットしていくことは重要だなぁと実感した。
Jun 09, 2007
音楽会
あんまりこのページ見てる人がいないと思うのであれですが、一応アナウンスということで。本日17:00~21:00まで「ゲストハウスせんたん」にて音楽会が開催されます。ピアノ、ギター、カホン、歌など盛りだくさんです。僕もDJとして参加する(かもしれない)ので、お時間のある方は是非お越しください。
21:00以降は、学生宿舎のラウンジにて飲み会がありますので、そちらのほうも是非。
May 26, 2007
復帰
まだ痛みが残っているため本調子とまではいかないが、ある程度動けるようになったので10日ぶりぐらいに研究室へ。しばらく引き篭っていた間にM2の就職組の人々がみな就職活動を終えていた。みなさん、おめでとうございます:-)
May 18, 2007
NY滞在期間
NYUの関根先生からメールが。7月までの間NYUでの研究の準備に時間を割けれるかどうか聞かれる。
すみません、まだ何も進んでません。そして行くまでに何も進められそうにありません・・・
あと、NY滞在期間がほぼ確定。7月頭~8月30日or31日までということになった。
2ヶ月弱と短いから、できることは限られそうだな・・・。
May 16, 2007
急性の血栓性***
2日ほど前から痛みが出ていたのだが、今日起きたらまともに動けないほどの激痛になっていたため、これはまずいと思って病院へ。 診察の結果急性の血栓性***(***は3文字です。すべて書くのはアレなので隠しておきます)で、手術しなければならないとのことだったので、すぐにしてもらった。 手術は15分ほどで終了。本当は通常2,3日入院する必要があるとのことだったが、「できれば入院は避けたい」と申し出たら帰らせてくれた。 数日間は安静にしようと思うので、その間仕事は進まないと思いますが、よろしくおねがいします。
それにしてもCamera-ready提出前じゃなくて良かった。もう少し早かったら提出が危うかっただろう。
May 15, 2007
Camera-ready提出
deadline25分前ぐらいに提出完了。最初の提出ほどではなかったが、今回も最後は慌しかった・・・ reviseだからそこまで時間はかからないだろうと甘くみていたのがそもそもの間違い。 いろいろと情報を追加したり構成を変えたりして変更点が結構あったので、最後の方はいろんな人の助けを借りてなんとか形にすることができた。 助けてくださった方々、本当にありがとうございました。
とりあえず今日は部屋で寝よう・・・椅子の上での生活が続いたせいでお尻が痛い。
May 12, 2007
paper revision
カメラレディのdeadlineが14日(日本時間では15日(火)の12時59分)と迫っているため、論文修正中。
reviewerからのコメントを論文に反映させるためにデータを見ているところだが、見ることで新しく気づくことが多い(それだけ分析が足りてないということだけども)。
コメントをもらって初めて気づくことは結構あるし、それを反映させていくことでよい論文になっていくので、通るかどうかは別にしても論文を投稿することは重要だなぁと思う。
修正点が多いのでdeadlineまでに全て直せるかどうか怪しいが、やるしかない。deadline過ぎたらもう直せないのだから。
しかし、ねむいー
May 11, 2007
IJCNLP 2008@Hyderabad, India
The Third International Joint Conference on Natural Language Processing (IJCNLP 2008)
のPaper Submission Deadlineは7月末(会議は来年の1月)。これを逃すと当分の間会議が無いので、何か出したいところだけれども、あと3ヶ月弱か・・・
この僅かな間に成果を出すというのはなかなか厳しいけれど、(本場のインドカレーを食べるために)頑張ろう。
追記:URLが変更されていた(Manabu Sassano's Logより)
出張のための手続きやら
今月、来月と出張の予定がいろいろと入っているので、日程調整したりホテルの予約、航空券の手配などやる。
今のところの出張予定はこんな感じに。
- 5/24 - 5/25 NL研@東京
- 6/19 - 6/21 人工知能学会全国大会@宮崎
- 6/22 - 6/30 ACL2007、EMNLP-CoNLL2007@Prague, Czech
- 7/上旬 - (8 or 9)/? New York
宮崎以降の予定が大変なことに・・・。というわけで6月後半から9月ぐらいまでいなくなりますので、よろしくおねがいします。
May 10, 2007
グラフの全域木の数
グラフの全域木の数の計算方法をちゃんと知らなかったので調べたところ、Matrix Tree Theorem(行列木定理)なるものがあった。
Matrix Tree Theorem
グラフGの全域木の数は、Gの次数行列(degree matrix)からGの隣接行列(adjacency matrix)を引いた行列の余因子と等しい
Matrix Tree Theorem [WolframMathWorld]
EMNLP-CoNLL 2007のAccepted Papersの中に、
"STRUCTURED PREDICTION MODELS VIA THE MATRIX-TREE THEOREM"
Terry Koo, Amir Globerson, Xavier Carreras and Michael Collins
行列木定理による構造予測モデルという話があるけれども、どういう話なのか、気になるところ。
May 07, 2007
GW
5/3
PCDJをするための機材を買いに難波まで出かける。
いろいろと悩んだ結果x-session proという安いDJ用MIDIコントローラを購入。
作りは微妙だが、とりあえずこれでMixを作るための環境は良くなった。
難波に来たついでに、ずっと行きたいと思っていたMagic Spiceというスープカレーのお店に行こうとしたが、
調べてみたら定休日だった。
5/4
久しぶりにShantiでディナー。
5/5
アジャンタに行くも、時間が遅かったためいつものが売り切れており、
やむなくとりの薬膳スープを注文。やっぱりかしみいるスープの方がよい。
あと、あのとりは重たい。
5/6
「心」にて甲イカとほうれん草のイカ墨スープカレーを食べる。
イカ墨がスープにコクを与え、なおかつトマトの酸味が加わって絶妙な味わい。これははまりそう。
行ったのはこれで3回目だが、もう既に店員さんに顔を覚えられていた:-(
Apr 29, 2007
心
AEON高の原ショッピングセンター内のスープカレーのお店「心」に行ってきました。
スープは一種類だけですが、具材のバリエーションが豊富なので結構楽しめそう。
季節ごとの限定メニューもあるようです。
今日食べたのは14種の野菜のスープカレー。

Apr 28, 2007
Apr 26, 2007
Apr 24, 2007
CoNLL shared task all scores
CoNLL shared taskの全チームの結果がいつのまにやら発表されていた。何人か日本人の名前もあって、その中で"Nakagawa"さんという方がUnlabeled Attachment Scoreで1位(!)、Labeled Attachment Scoreでも2位ですが、この方はもしかして・・・?
食欲
最近の気温の上昇で食欲が減退してきて早くも夏(春?)バテかと思っていたが、学食の定食を食べれるぐらいに回復してきた。
原稿書きに追われて完全な夜型生活になっていたのが、正常なサイクルに戻ってきたせいかな。
Apr 22, 2007
Introduction to Statistical Relational Learning
Statistical Relational Learningという本の出版をずっと待っていたのだが、調べてみたらMIT Pressから今年の8月に出版されるらしい。
editorの人のページに行くと、
Ben Taskar and I are currently editing a book on Statistical Relational Learning.となっていて、随分と前からこのままだったので、いつ出版されるのか気になっていた。
Apr 17, 2007
test20070417.mp3
今までとはちょっと違った雰囲気。
まだラフの段階なので音数が少なくて単調に聞こえるかもしれませんが、こんな感じの曲を作りたいということで。
Apr 16, 2007
JSAIの原稿submitted
人工知能学会全国大会の原稿が今日締切だったので提出。基本2ページ、希望すれば4ページということだったのだが、どう考えても2ページでは書ききれないので、4ページで書いた。基本的には修士論文の話なので削るのが主な作業だったのだが、5ページぐらいになってからだんだんと削るのが厳しくなってきたので、あの手この手を使ってなんとか詰め込んだ。
Apr 11, 2007
test20070411.mp3
前の曲(test20070406.mp3)から、メインのシンセとベースの音色を変えて、各パートに対するEQ、コンプレッサなどのエフェクタのかけ方を変えただけですが、だいぶ雰囲気が変わりました。
帰省
奨学金申請のための書類を取りに、久しぶりに帰省。滞在時間9時間程度でしたが・・・家族みんな元気そうで良かった。うちの母方の祖母が86歳ですがまだまだ元気。父方の祖母は今年で98歳(!)ですがまだ元気。うち、意外と長寿の家系なんです。
Apr 06, 2007
Apr 05, 2007
Apr 04, 2007
CoNLL shared task 2007: top 3 scores published
Top3のスコアが発表された。参加チームは言語によって多少差があるのだが、全言語の結果を返したのは大体20チームぐらいというところ。意外と多いなぁ。
Labeled Test Dataが公開されたので、我々のチームの結果を出してみたのだが、Label Accuracyがかなり微妙・・・言語によっては平均を下回っているのもあったし。
もう少し細かく数字をみて、何故悪かったのか分析していくことにしよう。
Apr 02, 2007
CoNLL shared task 2007: submission of test runs 見送り
現状では新規性に欠けるということでボスの判断により今回はテストデータを返さないことに。無念。 僕担当のLabel Classifierの方もfeatureの選択をちゃんとできないままモデルを作ってしまっていて、良いLabel Accuracyが得られるかは結構怪しい状況だったからなぁ・・・
残念な結果にはなったけれど、現在のParserとLabel Classifierでどの程度の精度が出るかを見てみて、今後につなげていければいいかな。
Mar 28, 2007
論文submit&次のタスク
論文submit。締切が日本時間で27日の12時59分だったのだが、朝になってこれはまずいから直接texファイルを修正しようということになって先生方に手伝っていただき、12時55分ぐらいにギリギリsubmitできた。先生方にはいろいろと迷惑をかけてしまったなぁ・・・。話としてあまり綺麗でないことと、採択率が20%前後になりそうな感じなので正直厳しそうだが、書いたことで今まで見えてこなかったところが見えてきたので良かったかな。
3日ほどベッドで寝てなかったので、submitの後フラフラの状態で部屋に戻って27日の15時ぐらいに寝て起きたら28日の11時だった:-(
次は日本時間で4月1日朝締切(1日ほど伸びたらしい)のCoNLL Shared Task 2007。いい結果が出るといいなー
Mar 15, 2007
英語で論文書き
とうとう国際会議へ投稿することになったので、拙い英語で論文を書き始める。読むのとは勝手が違って(といっても英語の論文をスラスラ読めるほどの英語力は無いが)非常に難しい。基本的には修士論文の話なので、日本語を英語にすることが主な作業になるのだが、言いたいことがぱっと英語化できないし、論文特有の書き方というものがあるので、他の論文の書き方を参照しつつちょっとずつ進めているというところ。こんなペースでは到底間に合わないな・・・。
Mar 13, 2007
音ネタ
一週間ほど前に注文していた音ネタがようやく到着。キックなど単発のサンプルが意外と少なくて損した気分になったが、プログレッシブ色を出すために必要で欲しいなぁと思っていたCongaの音が入ってたのでまあよしとしよう。
Mar 10, 2007
修士論文最終版提出
修士論文の最終版、なんとか無事(?)提出。なんだかんだで最終版に載せる実験結果が、締切当日まで揃わなかったため、かなり危険だった・・・
締切30分前に描いたあのP-R曲線、一生忘れないだろう。
Mar 07, 2007
前田先生と食事
食堂で昼食をとっていたら、論理生命学の前田先生に「ここ、いいですか?」と話しかけられ何と一緒に食事することに。前田先生は、自分の修士論文の発表会の時に司会をされていたので、それで顔を覚えていただけていたようだ。
発表の話になって、「あれ新しいモデルですよね?自然言語でもこういう人いるんだーと思いましたよ」と言われて嬉しかった。修士論文の発表では質問に対して適切な回答ができなかったところがあり反省点が多い発表となってしまったのだが、機械学習のエキスパート集団である論理生命の先生からこう仰っていただけると、とても励みになる。
輪講の話になって、自然言語の方では輪講が続かなくて困っているんですよ(DMLAIEのこと)という話をしたら、論理生命でも進め方にはいろいろと苦労されているようだった。お薦めの機械学習本を聞いたら、やはりBishopのPattern Recognition and Machine Learningはいいらしい。ただ、分量が結構あるので輪講でやるとなると結構大変ですよねぇという話になって、確かにそうだなと。来年度のDMLAIEでの輪講の候補には入っているようだが、さてどうなることやら。
Mar 04, 2007
wxWidgets
急にWindowsのGUIアプリケーションを作らなければならなくなった(というかもともとコマンドラインで使ってもらうつもりだったが、GUIにしてくれという要求があった)ので、wxWidgetsと格闘中。あと1週間ほどで動くものを渡さないといけないので時間が迫ってきているのだが、なんとか間に合いそうな感じになってきた。GTK+をちょっといじった経験と、言語は違うがJavaのSwingを使ったアプリケーションの開発経験があってよかった・・・。
Feb 28, 2007
追加実験準備
修士論文&会議投稿用に追加実験するため、コーディング。スピードが要求されていたのでコードが酷い状態になっていたが、分割できるところをモジュール化したことでだいぶすっきりした。さて、早いところ実験を終わらせて修論を仕上げてしまおう。
丸井系
ブランドの比較サイトはないかと探していたら、最終的にここに行き着いた。
いろいろとアレだが、情報はまとまっていそう。
この分類では自分は丸井系に属するようだ。だが、丸井代表イレブンの中には入ってなかった。
Feb 25, 2007
Feb 23, 2007
Feb 21, 2007
pan
クラブミュージックでは特にそうなのですが、音圧をいかに上げるかというのが重要な要素の一つとしてあります。Mixする時に自分の好きな曲と自分の曲をつないでみて、違和感が無ければOKというのが良し悪しの一つの指標としてよく言われているのですが、比べて聞いてみると明らかに自分の音がショボイ。いかに音圧を上げるかというところでリミッター使ったりしながら試行錯誤していたのですが、今になってようやく音圧が足りない印象を受ける理由がわかってきました。どうやらPANを上手く使ってなかったということみたいです。ハイハットなどのリズムパートを左右に振ってみるだけで音の広がりの印象が全然違います。
むちゃくちゃ時間かかってますが、こちらもマイペースでやっていきます。
追記:かといってPAN振りすぎると圧迫感が出てしまうので、難しいところです。
Feb 19, 2007
MLpedia
MLpediaなるものを発見。Machine Learningに特化した百科事典ということだろうが、まだ発展途上という印象。MLpediaよりもWikipedia(en)の方が詳しく書かれている項目が多いし。
週末
ちょっとは研究を進めるつもりだったのだが、結局しっかりと休息をとってしまった。
土曜日、京都のスーパーボウル城陽まで行って玉ころがし。学生は1G200円と激安なので、出費はあまり気にせず投げられる。一般人も300円ほどで投げれるみたいだが、こんなんで採算とれるのか?
夜、アジャンタでかしやさい。他に客がいなかったので、マスターともう一人の店員さんとで世間話する。頻繁に通っているのでいつのまにやら顔を覚えられてしまった。
日曜日、注文していたLGの
L204WT-BF
が届く。20インチ、WSXGA+(1680×1050)のワイド型で33000円程度。良い買い物だったと思う。横幅なんかは広すぎてまだ違和感があるが、作曲はだいぶしやすい環境に。次はこれかな。あとオーディオインターフェースも買ってPCDJができる環境を早く作らなければ。
午後は美容院へ行くため奈良市へ。予約の時間まで1時間ほどあったためVIVREで暇つぶし。本でも探そうと本屋に向かう途中、いつも服買うときにお世話になっているhayashiさんにつかまった挙句、ベルトを買う羽目に・・・。その後何故か体調がおかしくなり、結局美容院は諦めて帰宅。
Feb 14, 2007
Feb 08, 2007
Feb 01, 2007
Jan 30, 2007
急性胃炎?
数日前に風邪薬を"空腹時に"飲んだのが悪かったのか、完全に胃がやられてしまっている。以前、同じような症状の時に飲んで劇的な効果のあったガスター10をとりあえず飲んで処置してみたもののあんまり治る気配がしない。修論提出日に良くなっていなかったら病院へ行ってみるかな。
追記:うー、吐き気が酷すぎて研究室で作業できない。なんでこんな時に!
Jan 28, 2007
原稿の書き方
今はEmacsを使って修士論文を書いているのだが、どうも全体像が把握しにくいなぁと思いながら書いていた。 daiti-mさんはまず紙に書いてそれからTeXで清書するそうだ。なるほどと納得。そちらの方が絶対いいと思う。数式はさすがにいきなりTeXというのは辛いので最初紙に書いたけれど、全体の構成から何を書くかまで全部一度紙に書いてしまった方が良い論文が書けると思う。修士論文はもう手遅れだけれど、次の原稿ではまず紙に書いて整理してから書いてみることにしよう。
Jan 26, 2007
TOEIC
15日受験だったが、もう結果が返ってきた。この時点でまだ修士論文に載せられる数字が出ていなかったので全く余裕の無い状態で受けた(勿論事前に練習する暇さえなかった)のだが、それでも50点UPしていた。Readingはほぼ変わらなかったが、Listeningが50点ほどUPしていたので、アメリカ行きの成果が出たということか?
Jan 23, 2007
人工知能学会全国大会
申し込み時に論文の提出までしなければならないと思っていたので、実験が遅れていて間に合いそうもないということで今回はパスするつもりだったのだが、どうやらアブストラクトだけでよいとmasayu-a助手が教えてくれたので、相談した結果投稿することに。
論文提出は4月でまだ余裕があるので、修士論文書きつつもう少し面白い話にもっていければなぁ。
Jan 21, 2007
もがいてもがいて苦しんで
なんとか修士論文に載せられる結果が得られました・・・ここまで長かった・・・。
残りあと10日と少し。これからラストスパート・・・といきたいところなのですが、どうやら風邪をひいた模様。
まだ楽にはさせてくれないのですね。

