BIG DATA LAB
オンラインインタビュー
— フランスの官僚技術者養成機関グランゼコールとは?
— アクチュアリーとデータサイエンティストの違いは?
— 保険業界におけるデータサイエンスとは?
AXA データサイエンティスト兼アクチュアリー
Marion Favre d’Echallens
2021年9月2日取材
2022年2月13日掲載
『精度が高いモデルでも、
ビジネス的な観点で論理的に説明できないものは後々運用されない。』

略歴
フランスの官僚技術者(テクノクラート)養成機関であるグランゼコールの一つである、サントラルパリを首席で卒業後、AXAにアクチュアリー及びデータサイエンティストとして就職。顧客行動・保険リスク算定に従事している。
フランスの官僚技術者養成機関、グランゼコール
グランゼコール時代に多数のインターンシップや留学を通し、
保険業界でのデータサイエンティストへ。
— 本日はお忙しい中インタビューに応じていただきありがとうございます。
まずはMarionさんのバックグラウンドについてお伺いさせてください。
フランスの高校を卒業した後、グランゼコール準備学級(Classe Préparatoire)に進みました。グランゼコール準備学級では、フランスの最も優れたグランゼコール(技術者養成学校)やビジネススクールに進学するため、数学と物理学を2年間集中的に勉強します。
準備学級の最終試験を終えて、サントラルパリと呼ばれるグランゼコールに無事進学できました。サントラルパリは、所謂官僚技術者(テクノクラート)養成機関で、ほぼ全ての自然科学や工学を学べます。
— フランスの官僚養成学校やその準備学級というシステムは諸外国でも特殊のように思いますね。
サントラルパリではどういったことをされたのでしょうか?
サントラルパリでは数学の基礎理論と実社会への応用を、コースを通して4年間勉強しました。最終的にはデータサイエンスを専攻し、機械学習・深層学習・自然言語処理・プログラミングに関する良い授業を受ける機会をいただけました。
途中半年間スウェーデンに留学し数学・データサイエンスに関する勉強をしたり、フランスでインターンを三つほどしたりしました。インターンシップは半年のものを2つと、4ヶ月のものに一つ、保険・銀行・医療研究機関にそれぞれ参加しました。
— 4年間の中でインターンや留学の比重が大きいように感じますね。
統計学を専攻しようと思われたのはどうしてでしょうか?
シンプルに、その応用可能性が巨大で素晴らしいと思ったからです。この領域は計り知れないほどの数の疑問や答えを生み出します。
そして、データは私たちの周りの至る所にあります。世界的に電子化が進む現代では尚更です。データから挙動を説明し、未来を予測し、戦略を実行するできることは素晴らしく、挑戦し甲斐があると思いました。
— 数学科出身のデータサイエンティストとして、多くのキャリアの可能性があったと思います。
保険業界のデータサイエンティストとしての就職を選択されたのは、どうしてでしょうか?
保険領域でキャリアを開始しようと思ったのは、在学中最後のインターンシップでその機会をいただいたからです。銀行なども応募したのですが、AXAのチームは反応が早く魅力的に見え、この会社に決めました!
より発展した保険リスクモデルを作るアクチュアリーと、
異なる分析手法やデータに対応するデータサイエンティストは、
保険会社において補完し合う存在
アクチュアリーと
データサイエンティストの違い
— AXAのデータサイエンティストとしての、典型的な一日を教えてください。
複数のプロジェクトに関するコーディングやプレゼンの用意、そしてそのミーティングに参加するのがよくある一日です。
データアナリストとして、戦略的な意思決定のため顧客の挙動を理解し、その挙動を機械学習によって予測します。オンライン講座で勉強していることもありますね。
— アクチュアリーとデータサイエンティストの違いはあるのでしょうか?
今日、この二つの職業の区別はありますか?
あくまで個人的な意見ですが、アクチュアリーは保険に特化したデータサイエンスを習得されるのに対して、データサイエンティストは種類関わらずの機械学習のモデルを習得されています。データサイエンティストがより広くの領域をカバーしている一方、保険領域に関する発展した知識が比較的乏しいかもしれません。
保険会社では2つの職種は補完し合う存在だと思います。
そして経験上、アクチュアリーとデータサイエンティストには類似点はあるものの職能として異なります。
アクチュアリーはより発展した保険リスクモデルを作る一方、データサイエンティストは異なる分析手法や異なる種類のデータに対応ができます。
ただ、これはあくまで私個人の見解で他の方は違った視点を持っているかもしれません。
説明可能性という点について、学校よりもむしろ実務においてその重要性を痛感する。精度が高いモデルでも、ビジネス的な観点で論理的に説明できないものは、後々運用されない。
保険領域における大事なデータサイエンスの要素とは?
— リスク分析に特化したアクチュアリーと汎用的なモデリングを行うデータサイエンティストといった構図でしょうか。
それでは、保険領域におけるデータサイエンティストに特筆して大事になる知見や技術はどんなものでしょうか?
保険領域におけるデータサイエンティストは、機械学習モデルの理論的な背景について常に注意し、正しく分析を行い説明でき、そして誤りを発見できる必要があります。
説明可能性という点について、むしろ学校よりも実務においてその重要性に痛感させられます。
会社では自身の仕事について、どんなバックグラウンドの方に対しても説明ができる必要があります。これは難しく、訓練がいります。
いつもモデルの結果についてビジネス的な視点による意味を結びつける必要があります。
モデルのゴールが常にビジネスや顧客のためにあることを忘れてはいけません。
精度が高いモデルでも、ビジネス的な観点で論理的に説明できないものは、後々運用されません。
最後に
— 今着目しているデータサイエンスの領域はありますか?
自然言語処理・テキストマイニングに特に魅了されます。太古から存在する言語を分析できることは素晴らしいことだと思います。
NLPに関するプロジェクトに少し従事しましたが、世界に存在する言語の多様さやそれぞれの複雑さによる難しさに直面しました。この領域は、まだかなり進歩の必要な領域だと思います。
— 最後に、データサイエンスの仕事で好きなことと嫌いなことを教えてください。
実分析の部分が好きです。モデルの結果を見て、理解を試み、意味を与える一連のプロセスです。新しい挙動を予測したり、予測結果から結論を導くところも好きですね。
データ準備の段階はあまり好きではありません。データ整形の段階でデータの一貫性や頑健さを保つ必要があります。長くて冗長であり、常に楽しい作業ではないですね。

田中統
Interviewer