恐れることなく、データサイエンスと未来へ。多摩大学経営情報学部専任講師・崎濱栄治氏インタビュー。
データサイエンスは、最も期待の大きな分野の1つだが、なぜこれほどまでに注目されるようになったのだろうか。どうもデータもしくはデータを取るということに対して、少し恐怖や違和感がある。例えば、最適化されたオンラインストアから趣味にぴったりな商品がレコメンドたり、SNSで興味のあるニュースが続々と表示されたりする。こういったことがある度に自分の生活が監視されているような気分になり、便利と引き換えになにかとても大事なデータを奪われているようにすら思う。これからデータが私たちの生活をどうやって変えていくのか、私たちはどのようにデータ社会と向き合って向かっていくべきなのかを多摩大学経営情報学部専任講師で分析コンサルティング会社も経営する崎濱栄治氏に聞いてみた。
〈プロフィール〉
崎濱栄治:1997年横浜国立大学経営学部,2006年一橋大学大学院国際企業戦略研究科卒,2016年横浜国立大学大学院博士課程後期入学.経営修士(専門職).三菱UFJ信託,SPSS,みずほ第一FT,Amundi Japan,イルグルム,F@N 等を経て2020年4月多摩大学着任.INFORMS,EMAC,AOM,日本マーケティング・サイエンス学会,人工知能学会,日本証券アナリスト協会等の各会員.JDLA Deep Learning for GENERAL
ビジネスから、アカデミックなデータサイエンスの世界へ。
-崎濱先生は、現在多摩大学の教員ですが、元々はビジネスの世界にいらしたんですよね?
崎濱:経歴を話し出すと、非常に長いので、少し端折りながら話します(笑)。もともと証券の世界に興味がありました。大学時代に証券アナリストの受験資格が学生にも認められたんです。その時に学生第一号として、一部試験に合格して信託銀行に就職するところからキャリアスタートしました。
-華々しいスタートですね。
崎濱:そう思いますよね(笑)。でも当時はまだ支店に2台しかPCがないような状態だったんです(笑)。今でいうブルシットジョブの温床で、理想と現実のギャップの大きさのあまり半年で辞めてしまったんです。世間知らずの若気の至りです。それから、音楽の世界にいたり紆余曲折あって、SPSS(2000年IBMに買収)に入社。ここからデータ分析や統計の世界に入りました。データマイニングソフトを手がけている会社だったんですね。
-ようやくデータというキーワードが(笑)。
崎濱:その後、興銀第一フィナンシャルテクノロジー(現:みずほ第一フィナンンシャルテクノロジー)に入ったのが、人生の転機でした。この会社では、日本でもトップクラスのアカデミックな人材が多くいるような環境だったんです。大学の先生と組んで手がけるプロジェクトも当たり前にありました。スタンフォード卒の上司の下で、論文を読んだり、実証テストをやったりする社風もあったので、ここで随分たくさん学ばせていただきました。その後のキャリアではフランスの資産運用会社で年金積立金管理運用独立行政法人(GPIF)からお預かりした2000億円を運用するクオンツファンドマネージャーを手がけた後、大阪のベンチャー企業で金融工学を応用したインターネット広告関連の研究をするなどしていましたね。
-かなりビジネス畑でご活躍されていたんですね。
崎濱:そうですね。最終的なビジネスキャリアでは、インターネット広告企業であるファンコミュニケーションズで大学との共同研究プロジェクトなどを手がけていたんですが、研究への意欲が強かったので、2020年から多摩大で経営情報学部専任講師として勤務しつつ、横浜国立大で博士を目指して年下の先生の下で修行中です。同時に複数の企業のデータ分析コンサルティングも手がけています。
-一方で崎濱先生は、旧姓「豊澤栄治」として「アイドル市場における「BABYMETAL」のポジショニングを主成分分析で検証する
」ですとか、「アイドル戦国時代、推せば状況は変わるのか?乃木坂・AKBと卒業の関係をロジスティック回帰分析してみた」などユニークな切口で研究をされていますよね。
崎濱:紅白歌合戦を調べてみると、選考基準が「今年の活躍」「世論の支持」といった定量基準を基に総合的な判断を定性的に行っていることがわかりました。人とデータのあり方の1つとしても、面白いと思って研究してみたんです。アイドルという世代共通のコンテンツを使ってデータの有用性を伝えられたらいいなと思って発表しましたが、どちらかというとこちらはあくまでエンタメとしての研究です。アイドルの話をし始めたら、インタビューがそれだけで終わっちゃいます(笑)。ちなみに、現在はBABYMETAL推しです。
↑取材当時もBABYMETAL Tシャツで臨んでいただけた。
データサイエンスとは?
-これからは「データサイエンスの時代だ」って言われていますよね。
崎濱:もう10余年ずーっと言われていますよね。GoogleのチーフエコノミストHal Varian氏の発言を元に「世界一セクシーな仕事」とか言われることもありました(笑)。
-(笑)。
崎濱:人工知能分野で2012年に革命的な出来事が起こりました。簡単に言うと「機械が目を持った」。その理由として「深層学習を活用することで予測精度が一気に上がった」んですね。そして、近年クラウドで扱えるデータ量が増えたこと、大量データを自在に操れる「インフラが整った」ことというこの2つ条件が、データサイエンスが一般的にも注目されるようになった背景かなと思います。この辺りの話題は、松尾豊教授(東大)がわかりやすく解説してくださっています。(参考:人工知能は生命と同じく「目」を手に入れ、爆発的に進化する)
-そもそもデータサイエンスってどういうものなんですか?
崎濱:日本データサイエンティスト協会がデータサイエンスに必要な3つのスキルセットを定義しています。
1つ目はデータサイエンス力。これは、統計・機械学習・深層学習、そういった手法を正しく使うための力です。2つ目がビジネス力。これはいわゆるドメイン知識…様々な業界の背景やビジネスモデルにどれだけ精通しているかということですね。3つ目がデータエンジニア力。これは、データを整理・分析し、日常的な実務レベルでの運用を想定して実装することです。MLOps(機械学習チーム/開発チームと運用チームが協調し合う管理体制のこと)なんかも3つ目に含まれますね。この3つのスキルセットを統合したものが、データサイエンスを実行するうえで必要です。
-データサイエンスは、定義としてもビジネスと非常に密接なんですね。
崎濱:そうですね。「データは未来の石油である」とか言われていますが、これは言いえて妙なんですよ。石油と同じようにきちんと加工して使える状態にすれば、きちんとビジネスとして利益に繋がると思います。
-崎濱先生は、その中でどのような研究をされているんですか?
崎濱:一言でいうとデータサイエンスの応用研究をしています。例えば、分析対象も数値データだけでなく、文字の集合であるテキスト情報についても背後にあるトピック(文脈)を推定する手法が広まるなど分析技術は日進月歩で進化しています。先進的な分析手法を使うことによって同じ分析対象でも新しい発見ができるのではないかと考えています。
最近、人工知能学会論文誌に採択された研究は、機械学習手法と説明可能AI(XAI)を利用することで、機械学習の結果を人が解釈することを通じた役割分担の提案を行っています。
「集まるデータ」と「集めるデータ」。
-実際に企業でもデータを活用したいという声は多いのでしょうか?
崎濱:声は多いですけど、きちんとできている企業が少ないのが実情です。例えば、なんらかのデータを取っている企業は多いんですけど、そもそも無意味なデータの取り方をしているケースが散見されます。理想は、きちんと使えるデータを1からきちんと取っていくことなんですけど、そもそもデータが有益に機能するということを実感できてないのが問題ですね。
-すぐに結果が出るケースばかりではないですもんね。
崎濱:えぇ。特に日本は物質…手で触れられるものを大事にする文化が強いですよね。データやコンサルティングのような目に見えないものにお金を払うという文化があまりない。なので、僕は企業にコンサルティングする際は、データサイエンス的には無意味であっても現状のデータを使って実証実験して、小さな成果を積み重ねるような提案をしています。少しずつデータの有益性を実感してもらうことで、データに明るくなってもらう。
-実際に企業が「データをビジネスに活用したい!」と思った時に、どうしたらいいんでしょうか?
崎濱:星野崇宏教授(慶應大学)がおっしゃっているように「集まるデータ」「集めるデータ」の2種類に分けて考えるといいと思うんです。
-集まる/集める?どう違うんんですか?
崎濱:「集まるデータ」というのは、Googleアナリティクス(Webサイトのアクセスについて分析ツール)のデータやスマホを通した行動ログよいうような、自動的にログがどんどん蓄積していくデータを指します。一方、「集めるデータ」というのは、アンケートのように計画的に欲しい情報を集めるものを指します。分析対象となるデータはどちらのデータなのか。この「集まるデータ」「集めるデータ」のバランスを取って、思考の軸として考えると企業でも活用しやすいデータになると思います。
-なるほど!
崎濱:分析者の観点からすると、なるべく多くの種類のデータを、長期間保存しておいて欲しいのですが、「集まるデータ」に関しては、場所代がかかるんですよ。サーバーにためておくだけでもランニングコストがかかります。なので、企業でKPI・KGIを設定したうえで、「集まるデータ」「集めるデータ」にバランスよく費用を配分してきちんと使える形式でデータ収集していく。現在、全ての企業がこの体制を少しずつ作っていくことが必要だと思います。コストが明らかに低ければ極力長期間保存をおススメしたいところではありますが。
データと恐怖。その根幹。
-どうも、データサイエンス…データってものが怖くも思えます。自分たちの生活ログが自動で取られて活用されているような気がして苦手意識が拭えないようにも思えます。
崎濱:うん。それはすごくわかりますね。ヒトのDNA情報(ヒトゲノム)は約1GB程度と言われています。
-なんだか、すごく少ないデータ量にも思えます。
崎濱:そうですよね。その説を信じるなら、人類全体のデータをクラウドにアップロードすることも可能ですよね。エヴァンゲリオンの人類補完計画じゃないですけど、データを通して全人類が1つに溶け合うような(笑)。
-(笑)。
崎濱:そうすると、可能性のひとつとして社会主義的なシステムもできてしまうんですよね。最近では、ベーシックインカムだとかも話題にのぼることが多いと思うんですが、これもデータサイエンスへの注目と無関係な話ではないと思うんです。もっと大きく言うと、資本主義というシステム自体が機能しなくなることと言えるかもしれない。データサイエンスへの恐怖の根幹は、こういった「既存のシステムからの転換」が潜んでいる。
-実際にデータによる社会の変容で雇用も変わってきていますよね。
崎濱:少子化等、複数の要因はあるにせよ、1980年代に比べると世界の時価総額上位企業の社員数は大幅に減っています。巨大テック企業を見ても、売り上げに対しての社員数は、すごく少ないことが多いですよね。Uber eatsなども、考えようによってはアルゴリズムやシステムのラストワンマイルだけを人間が担当していると言えるかもしれない。これは、テクノロジーが主役の社会のように考えてしまうのも無理はない。
-視点によってはそういう社会に見えてしまいますね。
崎濱:様々なことをテクノロジーで自動化することで、人間は「クリエイティブな仕事」だけを手がけるようになるとも言われていますよね。ただ、このクリエイティブというのが微妙な言葉で(笑)。
-あぁ何を持ってのクリエイティブだということですよね。
崎濱:そうですそうです。クリエイティブを考えるときにひとつお話ししたいのが、入山章栄教授(早稲田大学)にお聞きした「両利きの経営(Ambidexterity)」です。「知の深化」と「知の探索」、企業内にこの2つの軸がないとイノベーションは起こらないというんです。
-深化と探索の両方を利き腕にするということですね。深化と探索、どう違うんですか?
崎濱:「知の深化」に関しては、既存ビジネスをマーケティングやロジティクス、あらゆるツールを使ってカイゼンすることです。そして、「知の探索」については、一見現状ではビジネスにおいて意味がなさそうで、今すぐ売り上げに繋がらなくてもやっておく方がいいこと…研究とか開発とか実験とかですね。この両軸を等しく進めることで、イノベーションが起こるという考え方なんですね。この軸に当てはめるとデータサイエンスが得意とするのは、今のところ圧倒的に「知の深化」なんですね。もしくは、「知の探索」を助けるための部分的なシステムとしてしか機能しない。なので、独創的な発想だとか、よくわからないものに関しては、人間のほうがまだまだアドバンテージがある。この分野を「クリエイティブ」な仕事と呼ぶのはどうかな、と。
-概念は理解できるのですが、どうにもピンと来ないです(笑)。
崎濱:今は社会が大きく変わりつつある過渡期なので、クリエイティブの意味合いも変わってきているんだと思うんですよね。いわゆる絵を描きます、音楽を作りますと言うことだけがクリエイティブではなくなっている。例えば先ほどのUberで言うと、同一の配送システム内でも「早く配達しよう」とか「数多く配達しよう」というためのアイデアもクリエイティブと呼べる。システムとの信頼関係と言いますか…きちんとシステムに依存すべきところは依存しながら、アイデアを出すことで、新しい意味でのクリエイティビティは生み出せるし、その中から新しい仕事もきっと生まれてくると楽観的に考えていたりします。
-少し、気が楽になりますね。
崎濱:個人個人の居場所で「クリエイティブであること」は多様に成し得ると思っていますよ。
データが導く多様な社会。
-もう1つデータサイエンスが信頼しきれない理由として、個人情報と密接に結びついているように思えることかなと思います。
崎濱:そうですね。EU一般データ保護規則(GDPR)などで分かるように、すでに個人データの保護は国際問題でもありますし、データサイエンス界でも非常に繊細な問題ですね。某国では、個人データの信用スコアが結婚にまで影響するなんて話もあります。SNSは日常的かつ当たり前に使う人が多く、すでにひとつの社会インフラでしょう。データを取られるのが怖いと思っていてもやはり便利には抗えないというのが現状かもしれませんね。
-日常的に、ショッピングサイトでも、すごく自分の趣味に合ったものがレコメンドされたりして、便利な反面やはり恐ろしくもあります。
崎濱:データサイエンス・行動経済学の取り扱いって難しいですよね。例えば、ビジネスがグロースするように、ユーザーが楽しめるようにと善意で作ったシステムであっても、結果的に作為的なシステムであるともいえる。Netflixは、ユーザーのデータから、どの作品がどのシーンで見られなくなったのか、どの俳優が出ているとどれくらいの結果が出るのか…こういったあらゆるデータを作品制作に生かすようにしている。もちろん、どれくらいの投資をするのかを含めて。
-もう作る前から、ある程度予測ができているんですね。
崎濱:これも、考え方によっては麻薬みたいなもんです。月数千円で、延々と絶対に自分たちのニーズに最適化された面白い作品が出てくるんですから。一方でこれは希望でもあると思うんです。これは、「一定の需要が確実に存在するのであれば、そこに投資することができる」ということでもあるんです。例えばマイノリティに愛されるすごくマニアックな映像作品であっても、愛する人が一定数いれば、きちんと予算を決めて作品を作ることができるということでもあるので。
-データやサービスをどう捉えるかで全然違って見えますね。
崎濱:データで可視化することで、需要に対して適切なものを作る。例えばAmazonのロングテール戦略もそうかもしれません。地方の職人の商品が売れるなど、悪いことばかりではないんです。どうしても資本主義的な「強いコンテンツにだけ資本が集まる」と考えてしまうかもしれませんが、そういった側面ばかりでないのかなと思いますよ。なので、使う側の善意によって、真の多様性を実現するためのツールにもなるんです。
これからの世界で失いたくないもの。
ーでは、最後の質問です。崎濱さんがこの先の世界で失いたくないものは?
崎濱:「お酒」「アイドル」というのが一瞬浮かびましたが…(笑)。
真面目にお話しすると「多様性」ですね。今では随分色々なところでこのキーワードが使われていますが、データを観測する一個人としても、多様性が受け入れられる社会であれればいいなと思っています。
Less is More.
「使う側の善意によって、真の多様性を実現するためのツールにもなる」。データ、もしくはデータサイエンスというのは、それ自体が事実であるがゆえ、私たちの心のあり様を否応無く突きつけてくる側面があると感じた。
崎濱氏は、ビジネス・エンターテインメント、あらゆる手でデータサイエンスを楽しめる世界にしようとしているのかもしれない。
(おわり)