BIG DATA LAB
インタビュー
—数理最適化から機械学習へ
— AIと倫理、フェアネス
東京大学理学部情報科学科 ・大学院情報理工学系研究科助教
理化学研究所革新知能統合研究センター客員研究員
黒木祐子
2021年9月6日取材
2021年12月18日掲載
『100年単位で残る研究をしたい。』

略歴
2021年東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程修了。修了時に令和2年度東京大学情報理工学系研究科長賞を受賞。2021年より同大学理学部情報科学科・大学院情報理工学系研究科助教。理化学研究所革新知能統合研究センター 客員研究員。
Microsoft Research Asia D-CORE 2020 Awardee。第38回井上研究奨励賞受賞。人工知能・機械学習のトップカンファレンス(ICML, IJCAI, AAAI, NeurIPS)に論文採択。 主に統計的機械学習や組合せ最適化に関わる数理的問題へのアルゴリズム研究に従事。
『線形回帰をしつつ、かつどのデータを取れば良いかを議論する。』
数理最適化から、機械学習・強化学習へ
— 現在研究をされている、多腕バンディット問題というのはどういったものでしょうか?
多腕バンディットは、意思決定問題の一つのモデルです。探索と活用のトレードオフを考慮して、効用を最大化します。真のパラメータを推定したい、けれど同時にリターンもしっかり得たいというモチベーションです。これは数学的には累積リグレット最小化問題として定式化されます。
一方で最適腕識別問題という別の定式化では、最小のデータ数で最適なパラメータを探索します。例えば各商品に関してd個の特徴があって、真の効用を推定する設定はd次元の線形回帰をしつつ,かつどのデータを取れば良いかを議論する、とも言えます.特にこの設定は線形バンディット問題と呼ばれており,推薦システムやオンライン広告に応用があります.
重要な観測点を選び、少ないデータ数で高精度な予測を作る。さらに、その観測に基づいて次に良いデータ点を選ぶ。これが多腕バンディット問題特に最適腕識別問題の本質かと思います。
— 元々は最適化理論を研究されていて、それから機械学習や強化学習に移行されたとお伺いしました。どういった経緯でその研究に従事されたのでしょうか?
元々は東工大でオペレーションズリサーチと呼ばれる分野で、数理最適化の研究をしていました。学部生の時は社会工学、大学院では経営工学系にいました。社会現象を数理的にとらえ、工学的に解決する領域です。
元々数学に興味があったのですが、社会に関わることにも興味がありました。なので、両方ができる学問である最適化理論を迷わずに専攻しました。
— 具体的には、どういった研究だったのでしょうか?
例えば工場の生産設計の数理計画です。需要の異なる複数の製品を計画的に製造し、利益を最大化します。他には、流通の問題があります。輸送コストを最小化するような効率の良い輸送ネットワークの設計問題に関する研究をしていました。
— その後に数理最適化から、強化学習に移行されたのはどういった経緯からでしょうか?
数理最適化における一つのテーマは、対象の最適化問題を解く難しさであったり、それをどう高速で解き得るかという部分です。私自身は、多項式時間で解けない問題に対して、その近似解を求める研究をしていました。
ただ、最適化問題で前提となるパラメータは現実で必ずしも分からないのです。そしてパラメータの設定によって、求めた最適解は変わってしまいます。
一方で強化学習は、ノイズが乗ったフィードバックをオンラインに収集して、データの収集と活用を同時に行います。未知のものを解決する、強力な技術だったのです。ずっと組合せ最適化をやってきましたが、データの不確実性を取り入れた機械学習理論を勉強するべきだと思いました。
— 大変貴重な観点で、とても参考になりました。
『100年単位で残る研究をしたい。』

なぜアカデミアに?
— 機械学習関連の研究をされていれば、民間企業からの引きも強かったかと思います。アカデミアで研究をされると決められた背景は、どういったものだったのでしょうか?
一つは純粋に、研究への興味です。研究をすればするほど、未解決問題に溢れていることが分かってきます。バンディット問題において報酬はサム(合計値)が前提とされることが多いですが、非線形報酬かもしれません。
多腕バンディットや強化学習のような逐次的学習を扱う問題では、報酬関数が時間変化によらない定常であることを前提にすることが多いですが、実応用では非定常かもしれません。定常性を仮定した学習アルゴリズムが非定常な状況に適応できる保証はなく、非定常性を考慮した新たな学習アルゴリズムの設計と理論解析が必要になります。
複数のプレイヤーがいるケースや、複数のアルゴリズムを並行して動かすような現実に想定される課題に対する理論は、まだまだ発展途上です。
理論研究者として、100年単位で残る研究をしたいのです。
そして、コロナ禍の今でも、研究を通した国際的なネットワークにいれることも魅力です。同じ研究に興味を持たれている方なら、国籍関係なく繋がれます。こういった部分に魅力を感じたんです。
『AIと倫理、フェアネス』
機械学習界隈全般に関する興味や課題
— 機械学習の領域で、最近の黒木さんのご関心はどんなものでしょうか?
一つは、敵対的なプレイヤーのいることを想定したモデルです。敵対者がいて、データを操作し、自分にとって都合の良いモデルにする場合です。
— 例えば、SEOによりページランクを上げようとする参加者がいる場合でしょうか。
そうですね。こういったプレイヤーの操作に対して、頑健な理論を作りたいです。
もう一つの興味は、フェアネスです。機械学習において、しばしば指標が一つのみ注目されてしまいます。偏った集団に有利なモデルになってしまい、これに強い課題意識を持っています。マイノリティに対して配慮するようなモデル、フェアなモデルに関心があります。
— ありがとうございます。最後に、AI業界全般に関する課題意識をご教示いただけないでしょうか。AI領域の最先端にいらっしゃる黒木さんに、お伺いしたいです。
この領域に限らないかもしれませんが、欧米至上主義な側面を危惧しています。巨大IT企業は欧米にあり、AI領域の研究者は少なからず良くも悪くも彼らの研究に強く影響を受けてしまうことがあると思います。
そしてもう一つは、この領域における日本のプレゼンスの少なさです。Women in Machine Learning (女性による機械学習)という国際ワークショップに参加しましたが、日本人の参加者がほとんどいませんでした。研究面をとっても、フェアネスの点でも、日本はまだまだ遅れをとっている現状だと認識しました。
— 大変貴重なお話をお聞かせいただき、ありがとうございました。


田中統
Interviewer