BIG DATA NET
インタビュー
「慶應から北欧、欧州、北米を経て、オックスフォードへ」国境無きAIリサーチャーの軌跡
オックスフォード大学
山田潤 氏
2021年9月27日
慶應義塾大学からスウェーデン、英国、米国を経て、
オックスフォード・ロボティックス・インスティチュートへ。
『やっとスタートラインに立てた。これからが本番です。』

経歴
慶應義塾大学とスウェーデン王立工科大学でコンピュータサイエンスと機械学習を専攻。ユニバーシティ・カレッジ・ロンドンにてデータサイエンスと機械学習の修士号を取得。複数の民間企業及び南カリフォルニア大学で画像解析・強化学習・表現学習の研究に従事。現在はオックスフォード大学における博士課程にてロボットラーニングを研究している。
『ロボットを学習させる領域、ロボットラーニング』
ロボットラーニングとは?
— この度はインタビューにご参加いただきありがとうございます。まず、山田さんの研究されている領域について教えてください。
今研究しているのは「ロボットラーニング」と言われる領域です。名前の通り、ロボットのための学習の分野で、機械学習をロボットに応用します。
例えば今、大きな工場にロボットがいたとして、それらの動作は人が逐一プログラムしています。対してロボットラーニングは、見たこともない物体や同一でない動作についても、ロボットが自分自身で対応ができるようにします。
— 何か具体例はありますか?
例えば家具の組み立てです。同じ家具だけではなく、少し違った素材を扱う場合。別の工場など違う環境に移動した際、例えば自宅で組み立てを行う場合。
これらの場合にロボットは状況に応じて動作を変化させる必要があります。
— なるほど。具体的にはどのようにロボットに学習させるのでしょうか?
大きく二つあります。
「強化学習」をすることもあるし、人の行動を見せて真似させる「模倣学習」があります。模倣学習は、人の動作や過去の経験を参考に学習させる方法です。
— ロボットラーニングという領域を初めてお伺いしました。比較的新しい領域なのでしょうか?
アメリカ・ドイツ・イギリスを中心に発展している分野です。
日本では東大・早稲田・NAIST等で研究されていますが、今のところ限定的だと思います。一方で国内では制御をはじめ、ロボットの研究そのものの研究はとても盛んです。
『画像解析から強化学習、そしてロボットラーニングへ』
ロボットラーニングに関心を持った経緯
— 元々は画像系の研究をしていたと伺いました。どういった経緯でロボットラーニングに関心を持たれたのですか?
仰る通り、学部生の頃は画像系の研究をしていました。途中から強化学習に関心を持ち、UCLで強化学習の応用研究をしました。捕食者と被食者のモデル (プレデター・プレイ) のシミュレーションなど、強化学習を生物に応用したものです。
このまま博士課程に進学しようと思ったのですが、Top Tier の機関に行くには業績が足りないと考えました。そこでアメリカの教授に訪問研究をお願いして、そこでロボットラーニングに出会い、のめり込んだんです。
『ロボットラーニングでは、いかに効率的に学習するかが鍵になる。』
ロボットラーニングの特徴
— 他のAIの領域と比較した、ロボットラーニングの特徴について教えてください
ロボットラーニングでしばしば遭遇する難しさは、サンプル数が少ないことです。シミュレーションなら2、3日で終えられますが、現実世界だと時間がかかりすぎてしまう。
一方で私は、シミュレーションだけでなく現実でのパフォーマンスを重視しています。よって、ロボットラーニングにおいてどう効率的に学習するかが鍵になります。別の状況からデータを引っ張り、転移したり、人間がお手本を見せたり。
— 強化学習と、先ほどお話された模倣学習ですか?
はい。強化学習と模倣学習は結構種類が違います。強化学習はエージェントが自分で学習していきます。一方で模倣学習は、教師付き学習です。
『日本・スウェーデン・英国・米国を経て、再び英国へ。』
4カ国の大学での実体験を元にした比較
— 山田さんは日本・スウェーデン・イギリス・アメリカ 四カ国の大学に在籍されていましたね。それぞれでの経験を通した各国の特徴をお伺いしたいです。
まず、慶應義塾大学と比較した、スウェーデンの王立工科大学の印象はどうでしたか?
スウェーデン人は勉強熱心だけど、メリハリがはっきりしています。普段はゆったりしていますが、いざ勉強するときはとことん勉強されます。
Quality of Life (QOL) は高かったですね。課題の量は比較的少ないですが、慶應よりは多かったです。
— なるほど。英国ユニバーシティ・カレッジ・ロンドンはいかがでしたか?
イギリスはスウェーデンほどではないけれど、ある程度メリハリがありました。授業は厳しく課題も多く、その頻度も高いです。常に追われている感じがありましたね。
ただ、やっている内容はとても身になりました。各プロジェクトでは、授業内容だけでなく自分で調査・研究する必要が多くありました。授業を通して論文を読み、書くを繰り返す経験はとても良かったです。
— 最後に、アメリカ・南カリフォルニア大学はいかがでしたか?

アメリカはイギリスと比べ、更に競争が激しかったです。研究室に所属しても、成果を出さないと切られます。だから、研究室に所属している場合、常に成果をアピールします。
教授に使えないと判断されたら切られてしまいます。テニュアトラックではない教授は、成果を出さないといけないから、学生にもプッシュします。だから研究室に所属する人は皆プレッシャーを感じます。
QOLは最も低かったですね。
— 噂に聞いていましたが、本当に過酷ですね。それでは、再びイギリスを選ばれたのはどういった理由でしょうか?
個人的にイギリスはバランスが良かったからです。
そしてオックスフォードには7つの研究グループからなる オックスフォード・ロボティックス・インスティチュートがあり、使えるリソースが多いのが魅力的でした。また、高名で比較的若い先生に直接見てもらえるのが良いと思いました。
また、研究室に修士の学生がいらっしゃいません。必然的に教授のリソースに余裕ができます。アメリカで研究をすると、自分自身ティーチング・アシスタント(TA) 等に時間を割く必要があります。オックスフォードではその必要がなく、研究する時間を確保する上で良い選択肢だと思いました。
もちろん、就職の視点ではアメリカの方が良かったかもしれません。研究室のツテもあり、ビザの悩みも減るからですね。
『オックスフォードを出た後は、
インダストリー系のリサーチ・サイエンティストに。』
博士課程後のキャリアプラン
— 博士課程の後はどういった計画をされていますか?
オックスフォードを出た後は、インダストリー系のリサーチサイエンティストになろうと考えています。自動運転系の会社で経験を積みたいです。
大学によって、アカデミック界とインダストリー界への進路を押す場所に別れるんです。ロボティックス・インスティチュートはインダストリー界へのコネが強いのが幸いでした。
研究を応用する意識が強く、自身の方向性がマッチしていました。教授が「卒業後の就職は心配するな」と言ってくれたのも嬉しかったですね。
その後は、母校である慶應SFCで教鞭をとったり、日本の企業のリサーチサイエンティストになったりしてみたいですね。
研究をしていく人生で見ると、やっとスタート地点に立てました。
これからが本番です。


田中統
Interviewer