データについて、世間には多くの"単純化されたセオリー"が広まっています。しかしそれらのセオリーの多くは過度に抽象的・虚言的で、現実世界でデータから価値を生み出すための十分な「解像度」を備えてないものが散見されるように思います。いま、データから価値を生み出すのに必要な「データについての理解」(=解像度)はどういったものなのか、事業会社や省庁といった分野での経験を持つ樫田光氏と、データエンジニアリング支援の組織立ち上げをリードしてきたprimeNumber社の山本が本音でトークしていくセッションです。
なお、本セッションの資料は、登壇者の樫田氏により公開されています。以下よりご覧いただけます。
いま、データに必要な解像度(Speaker Deck)
登壇者情報
樫田 光氏
デジタル庁 Chief Analytics Officer
外資系コンサルティングファームなどを経たのちに2016年に株式会社メルカリに参画し、データアナリストチームの責任者として事業のデータ分析・成長戦略の立案業務を行う。2022年よりデジタル庁に民間人材として参画、Chief Analytics Officerを務める。
山本 健太
株式会社primeNumber 取締役執行役員CIO
新卒でエンジニアとして広告テクノロジー関連の開発に従事。広告配信プラットフォームのフロントエンドおよびバックエンドにてWebアプリケーション開発やプロジェクトマネジメントを経験。2015年、代表田邊とprimeNumberを創業。データ収集・集計・機械学習・コンテンツ配信からなる「systemN ™」開発を経て、現在はprimeNumberにて取締役執行役員CIOとしてプロフェッショナルサービス本部およびデータイノベーション推進室統括にあたる。2020年度「Forbes 30 Under 30 Asia 2020のEnterprise Technology部門」選出。
データ分析は事業の「解像度」を上げるための行為

樫田氏:ビジネスシーンでは「解像度」という言葉をよく耳にします。カメラの解像度をイメージすれば分かり易いですが、見ようとする対象をいかに細かく描写できるか、対象物とそれ以外をどれだけ分離できるかを意味する言葉です。
今回のテーマである「データ分析」は、基本的には事業の解像度を上げるために行われます。「事業全体の売上高はいくらか」といった単一的(モノリシック)な世界観を、「カテゴリ別の売上高」「売上高を構成する顧客数と単価」といった粒度に砕いていくプロセスは、まさに解像度を上げるための行為です。顧客のセグメンテーションなども同様です。自社にとっての「お客さま」を複数の種類に人為的に分離し、事業の解像度を上げるための方法論だと捉えられます。
しかし、事業に対する解像度もさることながら、解像度を高めるためのツールである「データ」そのものについて、私たちは解像度が低いまま話しているという現状もあるように思います。私たちは「データ」という言葉やその性質について、十分な解像度を持って語れているでしょうか?
このセッションでは、データに関するいくつかの重要な問いと、それに対する世俗的な通説の解説、そしてその通説の「否定」を通して、データそのものに対する解像度を高めるという、挑戦的なテーマを取り上げたいと思います。
今回は、データと向き合う上で特に知っておくべきことを、4つの問いにまとめて、それに答えるという形でセッションしていきたいと思います。
Theme 1:情報量をデータ消費者の言語体系に調整すること

「データを使う」ことに正しい答えはない
樫田氏:まずは「データを使う」とはどういうことかについて考えてみます。よく社内から「データを使って何とかしなさい」などと指示を出されることがあると思いますが、そもそも「データを使う」とは具体的にはどのようなことを指すのでしょう?
山本:事業KPIの見える化や事業成長のドライバーを特定する武器として使うことではないでしょうか。そのため、私たちprimeNumberは「あらゆるデータを、ビジネスの力に変える。」ことをミッションに掲げて、お客さまの支援を行っています。
樫田氏:「データを使う」という言葉の具体的な意味については、業種や事業モデルなど、企業ごとの立場によって回答は異なりますよね。この問いには正しい答えはないと思っています。ただ唯一存在するのは、解像度が低い回答と解像度が高い回答の2つがある点です。
この問いに対する一般的な回答として「データを使うということは、データをビジネスに役立てることだ」という考えがあります。たしかにこの回答も間違っていないのですが、具体的な行動指針を立てるのには役に立たない、解像度が低い回答だと感じます。
データを使うとは:情報量をデータ消費者に最適化して調整すること

樫田氏:「データを使うこと」をかみ砕くと、それは「情報量をデータ消費者の言語体系に調整すること」だと私は考えています。この考え方のポイントは、データには消費者がいるという点です。
前職の話をすると、株式会社メルカリ(以下、メルカリ社)が手掛ける「メルカリ」は当時で1,000万人以上の月間利用者を抱える大きなサービスでした。
1,000万人以上の利用者のデータから何らかの情報を提供するとき、事業の意思決定者に1,000万人分の顧客データをすべてそのまま印刷して持っていっても話を訊いてもらえないでしょう。これは「事業の意思決定者」というデータ消費者に対して、情報量が適切に調節されていない状況です。そのため、例えば顧客を数個のカテゴリにわけ、それぞれの平均値を示すといったように情報を大幅に圧縮するなどして議論を行う必要があります。
しかし、これはAIのような別の種類のデータ消費者からすると、とんでもなくもったいない所業に映ります。「AI」というデータ消費者に対しては、1,000万人分のデータをそのまま渡せばよいでしょう。貴重な1,000万人のデータを平均や中央値という不正確な数字にわざわざ圧縮して情報量を削ぐ必要はありません。
つまり、誰がデータ消費者であるかによって、最適なデータの情報量は変わります。データ消費者にあわせ、必要なデータの粒度や情報量をうまく揃えてあげることが、「データを使うこと」であると私は理解しています。
情報量をデータ消費者に最適化して調整すること

樫田氏:具体的にデータの消費者について考えてみましょう。企業には、バリューチェーンがあります。
最上位の事業マネジメント層は「売上げを何とかしろ」というように言語体系が非常に抽象的でざっくりしています。彼ら/彼女らに対して、過度に細かいデータを持っていったとしても「売上の成長率はどうなってる?それ以上の細かすぎる数字には興味がない」と言われてしまいます。その一方で、アナリティクスを行う人や、計算資源など、より下のレイヤーに近づくにつれ、扱うデータの情報量は多ければ多いほど良くなっていきます。
それぞれのレイヤーに対してデータ量を調整する必要があることを認識した上で、どのようなデータを用意するのか、どのようなデータに見せるのかを考える必要があります。
山本:人間が見るためのデータと、機械が処理するデータは粒度が違うということ、そして人が見るデータもそれぞれのレイヤーによっていくつもグラデーションがあるということですね。例えばマーケティングの部署でも、個別のキャンペーンのデータを経営会議で報告するわけではありません。それぞれのユースケースに合わせてチューニングしますよね。
樫田氏:そうですね。同じ経営層でも「売上げ」に対して年間の伸び率しか興味がないパターンや、現場の企画担当はデイリーで先週と今週の差分を求めていたりと、必要なデータの準備も変わってきます。そこの理解を深めることが、データワークを使うための第一歩です。
山本:一方で経営層にサマリーされたデータを渡すと、サマリーを作成される過程で情報がそぎ落とされてしまい、経営層が本当は見たかった細かいデータを見ることができなくなってしまうというケースも出てきますよね。
樫田氏:その通りです。例え話をすると、人間は基本的に具材を生のままでなく、熱加工などの調理を行って摂食します。調理することで食べやすく、胃腸での消化率も上がります。しかし、加熱をすることで栄養は一部抜け落ちてしまいますよね。同じように考えると、人間が事業にデータを利用する場合は、情報の摂取の容易さと、それによる判断のしやすさが最も優先されます。加工食が生の素材に対して栄養面では適わないように、経営陣に渡す情報も元のデータが持つ情報量を100%保持するのはあり得ないことです。データの持つ「情報力✕消化率」の積が、最終的に事業に及ぼすことができるインパクトの総量であり、それを実現するための情報量の調整を試みることが必要です。
情報の摂取のしやすさは人によって違うことを理解し、データ消費者一人ひとりに合った調理の仕方を選ぶことが極めて重要になります。
Theme 2:データは意思決定と実行の間にある

意思決定と実行の間にあるものがデータである
樫田氏:「データ分析は何に使えるのか」という問いもよく耳にしますが、これは私が前職のメルカリ社で悩んでいたイシューのひとつです。よく言われている定説は「データは、意思決定を良くするためにある」ということです。
山本:データドリブンという考え方ですね。樫田さんとお話ししていく中で少し違和感に気づいていて、“ドリブン”という考え方はどこか受動的な部分があると思います。
樫田氏:メルカリ社に勤めていた頃、私のチームでは「データで意思決定をする」をミッションに掲げていました。しかしその後、様々な事業・様々なデータの使い方を見ていく中で、考え方がアップデートされました。現在は「データは意思決定と実行の間にある」と考えています。意思決定やデータ、事業についての解像度が高まるほど、「意思決定を良くする」という言葉は単純化しすぎているのではないかと思うようになりました。
「データによる意思決定」という言葉は一般的には次のようなイメージを想起させるかも知れません。会議室に多くの人が集まり、データを元に喧々諤々と議論、そして最後には「データの示唆通り、これでいこう」と決まり、次の日から物事が動いていく、と言った絵図です。たしかにこうした「大きな意思決定」の場面も存在するのでしょうが、リアルな事業の現場は日々の小さなオペレーション、実行場面における「小さな意思決定」の積み重ねで成り立っているのもまた事実です。
それまで何も決まっていない状態から、会議によって突然0%から100%の意思決定が進むことは現実的にはまずありえません。その前段階で、ある程度決まっていることもありますし、逆に会議では決まったことが現場でうまく実行されないこともあるでしょう。そういったことを防ぐために、実行がスムーズに進むように、事前の水面下の根回しが時に意思決定において必要だったりもします。そうした意味で、意思決定と実行は完全には分離されていないのが組織の実態だと思います。
僕はこれを戦略と実行の「熱伝導率が100ではない」という言い方をよくしています。データドリブンという言葉からは「大きな意思決定」のための情報提供が想起されがちです。しかしデータ分析の利用シーンとして、実はそうした「大きな意思決定」という市場はさほど大きくないと思っています。
データを「意思決定」のためだけにフォーカスしすぎない
山本:そもそも、意思決定を移譲していくことが組織としては必要ですよね。たった1時間の会議でゼロから話して決まる内容であれば、そもそも会議をしなくても決まるでしょう。会議に持ち込むまでに、さまざまな小さな分析や会話の積み重ねがあり、最終的な合意形成、一種の小さなセレモニー的な形に至ります。
樫田氏:意思決定を移譲していくことが大事であると同時に「意思決定をしないようにすること」が組織では大事だと思っています。今や事業や会社は、何のKPIが大事なのかと四半期ごとに時間を掛けて毎回議論していては、事業がスピード感を持って回せません。
事業計画の分解モデルや顧客のセグメントを一度作ってうまく現場浸透させてしまえば、それ以降はその枠組みの中で重要な指標や戦略について暗黙的に合意を形成することができるようになります。また、それらの分解モデルが実行と結びつきやすいものになっていれば、意思決定のための長い議論をショートカットし、事業目標に対して正しい方向性に人々を向けていくギミックとして機能します。
このように、意思決定と実行が分離されたものではなく、なるべく距離が近づけられる状況を目指すべきだと思います。

データを「意思決定」のためだけに活用しようとフォーカスしすぎず、もっと広い範囲の「実行」まで考えてみることが重要です。机上でデータについて考える人の視点では、データによって戦略が決まる、あとは戦略通りに実行がされるため、という世界観が見えていると思います。しかし、現実の世界では、戦略を決める際にはデータよりもそれ以外に考慮する要素のほうが遥かに多いですし、所与の前提によってデータによる単一的なアングルでの示唆では戦略に有用な材料を提供できないことも多々あります。むしろ、戦略が正しくてもそれをうまく戦略と整合するKPIにまで落とし込めていなかったり、現場が納得しておらずうまく動かなかったり、実行の精度や数字でモニタリングできておらずサボってしまったりと、「実行」にもデータでサポートする余地が多大に存在しています。データを使う市場という意味では、こちらのほうがむしろ大きいと感じています。
山本:データを基にして戦略が自動的に決まるのであれば、我々のようなスタートアップがビジネスできる余地がなくなってしまいますよね。ビジョンや登りたい山に旗を立てる、ということだと思います。そこに対して成功角度を上げていくために、データをいかにして使っていくのかが重要だと思います。
そして実行フェーズ、データドリブンとあえて言いますが、そこが染みついていることで、小さな意思決定を排除できて、ストレスなく一緒に働けるという世界観になります。
樫田氏:事業はどうしても人が絡みます。だからこそ、理想的な「意思決定」と現実的な「実行」の間には常に大きな溝があり、そこを埋めるためにデータがある、という解釈のほうが、経験的にはしっくりくると考えます。何かを決めることが大変であると同じように、決めた通りに動かし続けることも大変であり、だからこそデータをもっと使うべきです。
Theme 3:データに求められる態度とは?

セグメントに正解はない。そこにあるのは「世界をどう見たいのか」という“意思の反映”
樫田氏:「データは客観的なものであるべき」というこだわりを強く主張される方や、データの業務において主観を含んだ示唆を出すことに対して強いアレルギーを示す方はいらっしゃると思います。
山本:今回のイベント全体のテーマも「DATA is TRUTH」ですし、確かにデータは客観的で正しいものと印象を持たれやすいですよね。
樫田氏:まさに定説的には、客観性を担保できることはデータの一つの強みであるように思えます。しかし、客観的であることはメリットだけでなく、デメリットも多く、それについて考えて見る必要があります。「客観的/主観的」であることの解像度を上げてみましょう。まず結論から言うと、私はデータは主観と客観を組み合わせることが大事であり、むしろ「積極的に主観的であれ」と主張したいところです。敢えて強い言葉を使えば、データの客観性ばかりを大事にしても何も生み出さないことが多い。
では客観的なデータとは、具体的にどのような状態のことを指しているのでしょうか。「分析」という言葉は、「ある事物を分解し、それを成立させている要素を明らかにしていくこと」を意味しています。つまりデータ分析とは分解という視点と不可分です。
しかし、客観的な「分解」というものはこの世にあり得るのでしょうか。たとえば売上高を「新規」と「既存」に分解する場合、完全に客観的な基準というのはありえるのでしょうか。
山本:先ほど別のセッションでTBSラジオさまとお話しさせていただいた時に、新規リスナーにもグラデーションがあるという話をされていました。仮説をもってデータの切り方をしていくと、早く答えにたどり着いたり、施策に結びついたりすることがあると思います。
セッションレポートは以下からご覧ください。
「ユーザーと複数のプラットフォーム、攻略のカギはデータにあり。開局から70年以上のラジオ局が取り組むデータ分析とコンテンツ戦略」
樫田氏:「メルカリ」ではアカウント登録から28日以内や30日以内を「新規」と呼ぶことがありましたが、28日や30日という基準には何の客観性もありません。事業は1ヶ月単位で動くからとか、切りの良い30日で、とか、曜日の影響を受けづらいように7の倍数にしたほうが分析しやすいとか、人為的な都合と合わせて決まっています。

物事を分解することに「完全な客観性」が存在しないことは、認識論など人文学でもよく取り上げられるテーマです。たとえば、写真に写っているのは何という鳥でしょうか。日本人はこれら2羽とも「鳩」と認識しますが、アメリカ人は黒い鳩を「Dove」、白い鳩を「Pigeon」という別々の生き物だと主張します。ウマという動物を表す言葉の分解や、雨という自然現象の呼称でも同じです。
見る主体の世界の見方によって、物事を分解する基準は変わる。その基準に唯一絶対の正解はありません。人々が自分にとって都合の良い見方で世界を生きていくため、都合で世界を勝手に分解して線引しているだけです。そこには客観性が一切存在しない。
データは主観✕客観 の重ね合わせ。客観性は美しさであり、弱さであり、逃げである
樫田氏:一方で、自身がどういった主観を持っているのかを認識していることは、重要だと考えます。データに主観を入れるのであれば「どういった主観(視点)を、なぜ入れるのか」、「それによってどう事業がうまくいくのか」を解像度高く理解したうえで行う必要があります。
山本:「主観」という言葉の解像度を上げようと考えたとき、「意思」という言葉をイメージしました。「意思」を入れるためには、事業ドメインをしっかり理解する必要があり、ドメインエキスパートとして知見や経験があるからこそ、適切なセグメンテーションが可能になります。データと自分ならではの知見や経験を重ね合わせることで、その人だからこそできるデータ活用が可能になると感じました。
樫田氏:事業に対して、高い解像度と意思を持っている人に「正しい主観」が宿ると思います。意思を持って主観的である努力をする、そのために一生懸命に事業のことを理解することが重要なのではないでしょうか。主観的になれない人は自分が事業に対する自信、解像度、意思がないということの表れ、弱さの裏返しだと思います。「データは常に客観的であるべき」という考えは、はっきり言えば「逃げ」とも言えます。
行動の善悪は基本的に主観的なものです。過度に客観的過ぎる情報とは、行動に至るまでの間に距離があることを意味します。事業ではお金も時間も限りあるからこそ、データに対して客観的であることとそれによって起こることの意味合い、つまり行動からの距離というファクターをきちんと考えたほうがいいのではないかと思います。
「TROCCO」は、そうしたデータ分析のスピードを上げたり、ミスをしてもすぐに新しい分析ができたりと、柔軟なプラットフォームとして進化してほしいですね。
山本:ユーザーの方からいただく声でもスピード感の点はよく触れられます。1、2週間経ってもデータを見ることができなかった部分をツールで埋めることで、自分でデータを取得できるようになります。PDCAがそこでようやく回り始めます。
樫田氏:主観的であればあるほど、周囲からのフィードバックが重要になると思います。事業に合わない主観は軌道修正が必要なので、データを使うサイクルが早くなることが「主観的であっても良い」ことの一つの条件になると思います。その点は技術的にカバーできれば良いですね。
山本:データ分析は、掘り下げすぎるとキリがありません。ある程度見切りをつけて答えを出し、次に何をすべきかを考えることが重要です。仕組みで解決できるところ、データで判断できるところをそぎ落としていくと、より意味のある時間の使い方ができると思います。
Theme 4:データの価値は何で決まるか

データの価値は、ユースケースで決まる

樫田氏:データ価値は何によって決まるのかを考えることは、データに価値を見出すために何から取りかかるのかを考えることに等しいと思います。よく目にする考えとして「データ量が肝だ」「データ基盤が大事だ」「分析のクオリティが第一だ」などという言説があるかもしれませんが、これらは全て嘘です。
たしかにこれらによって価値を生む可能性は高まるのかもしれませんが、データの価値を決めるのは9割以上が「正しいユースケース」であるかどうかです。どのようなシーンで、誰に対してなんのためにデータを使うのかでほぼ決まると思います。
一般的に「データの価値」を主張する人は、ビジネスのありとあらゆる場面にデータを使うこと、データとビジネスを掛け合わせてバリューチェーン全体をブーストするといった意味合いで使っていると思います。
しかし、データ分析のアウトプットがうまく機能する範囲というのは、実は考えられているほど万能なわけではありません。データを使おうとする分野や、データの適用分野が間違っていると、リッチなデータや優秀な分析クオリティを投入しても、Gabage-In/Gabage-Outにしかなりません。どれだけ優秀な人材と豊富な資金を持っていても、ユーザーニーズがない市場に突っ込んだスタートアップが勝てないのと一緒だと思います。
逆に言うと、データを適用するシーンとして適切な場所から始められるのであれば、データが少なくても、データ基盤が貧弱でもうまくいく可能性が十分あると思います。どのようなシーンであれば勝てるのかというデータの価値を出すための必要十分条件を、解像度高く理解することが必要だと思います。
80%は「対他者で必要だから」 20%は「自身が知りたいから」

山本:ユースケースは仮説ベースで決まってきますので、トライ&エラーが重要ですね。「TROCCO」のご提案でもいきなりツールの導入ではなく、ROIやデータ活用に意味があるのかからお話してから、データ活用のご提案させていただいています。そこで一旦、「Excelでできるプレ分析から仮説を出してみましょう」といった提案を積極的に行っています。
樫田氏:そうした提案ができる専門人材がいるのは、すごくいいですね。起業家と同じでユースケースを見つける感覚は簡単ではありません。
一方で、例えば僕の今のフィールドである「中央省庁」では、データが役に立つユースケースの範囲がとても狭く、針の穴を通すような感覚です。なぜデータが当てはまるユースケースが少ないのかと言うと、事業を進めていく上でデータを見なくても、意外と困らないからです。
山本:今日の一番の逆説ですね。データがなくてもビジネスはできる、と。
樫田氏:まさに逆説的ですね。ゆえに、どういったユースケースであればデータが機能するかということは、きちんと知っておくべきことだとは思います。
組織を動かすことは常に難しいのですが、ゆえに「他者」が介在する場面と、データの相性を考えることは有用だと思います。対他者でデータが必要というのは、つまり「自分以外の誰かがデータを要求してくる」ということです。他者と議論し協働していくには、基本的にはデータなどのなんらかの共通理解が手元にあったほうがうまくコミュニケーションできます。
山本:コミュニケーションのツールとしてデータをどこに向けるか、コミュニケーションなしではビジネスを成長させることができないという考え方ですね。
事業とデータ両方に対して、高い解像度を持ちつづけること。そのために努力し続けること

樫田氏:企業や会社は、多くの人が集まり、一緒の方向を見て行動をする、大きなアートを生み出す装置として存在していると考えています。そこにいる人たちのコミュニケーションや向かう方向性を揃えたり、日々の行動が大きな方向性からずれないようにしたりすることが、良い成果を出すために重要です。そのためのツールとして、データが存在するという解釈でも外れていないと考えています。
山本:共通言語としてデータを使うということですね。企業においてはデータを基に同じ方向を向いて、違う価値観、違う職種の人たちが協働できるようになります。
樫田氏:人が多く集まった組織において、最もコストがかかるのが「疑うこと」です。売上がうまく伸びているかどうか疑い、とりあえず週に一回責任者からプレゼンするのは、とても面倒なことです。例えばデータでダッシュボードを作っておけば、こうした面倒は格段に減ります。
大きな組織で大きな成果を出すため、その方向性や人々の間で起こる摩擦やコストを最小化していく取り組みに焦点があたることはごく当たり前で、そこにデータが寄り添っていくことは極めて自然なことだと思います。
正直なところ、多くのデータに関する一般的な通説は非常に不正確で、無責任だとすら思っています。データについての解像度が低い人ほど、こうした一般的な粗い俗説を持ち出してきます。

データを扱う私たちにとって大事なことは、事業とデータ両方の根底に対して高い解像度を持ちつづけることです。そのためにも意識を保ち、努力が必要だと思っています。努力をせず、何となくそれっぽい話を信じることは、好ましくありません。
物事を常に十分な解像度で理解しようとするのは簡単なことではありませんが、だからこそビジネスパーソンに求められる重要な姿勢だと思います。データに対しても、事業に対しても、解像度を高めることをおろそかにせずに根底に対して思いを馳せられることが、データから価値を引き出せる条件だと思っています。