「移動で人を幸せに。」をミッションに掲げ、No.1*タクシーアプリ『GO』などを展開するGO株式会社。『GO』のダウンロード数は2024年4月には2,000万を突破し、移動に関するDXを推進するリーダーとして、業界を牽引している。
*data.ai by Sensor Tower調べ | タクシー配車関連アプリにおける、日本国内ダウンロード数(App Store/Google Play合算値) 調査期間:2020年10月1日~2024年6月30日
同社ではデータ分析基盤の運用にかかるエンジニアの工数を削減するために「TROCCO®」を導入。「TROCCO®」導入の背景とその効果、またデータ活用において、データ分析にとどまらず、データを生かしたプロダクトを生み出し続ける秘訣についてお二人に伺った。
※本内容は2021年12月取材時点の情報です。
導入のきっかけ
EmbulkとDigdagによるデータ連携で不具合が頻発。
データ分析基盤の運用ではなく、データ分析に時間を割きたいと考えるように
鳩 英嗣様(以下、敬称略):「Google Cloud Platform(GCP)」「Amazon Web Service(AWS)」「Microsoft Azure」のそれぞれに存在するデータをGCPのDWHサービス「BigQuery」に集約する構成へのリプレイスを検討していました。
リプレイス前の構成はデータパイプラインが複雑で管理コストが高く、障害発生時の対応手順も複雑で、データ分析基盤の運用に多くの工数が割かれていました。
また、RDB(Relational Database)一つを例にとっても、「SQL Server」「MySQL」「PostgreSQL」と、とにかくデータソースの数が多い状態でした。今後さらにデータソースが増えた場合の開発工数や、その後の運用コストを考えると、このままの状態を続けることは非常に厳しいと考えておりました。
「TROCCO®︎」を選んだ理由
Embulkのマネージドサービス=「TROCCO®︎」
鳩 :決め手は二つあります。一つはEmbulkの”マネージドサービス”である点です。馴染みのあるEmbulkを使用したサービスであれば導入がスムーズだと考えていました。マルチクラウドな環境に散らばったデータを単一の製品で収集できることもポイントです。さらに、データ分析基盤の運用コストを下げることが目的でしたので、マネージドサービスであることは絶対条件でした。TROCCO®︎はまさに我々が求めていたサービスでした。
もう一つは、TROCCO®︎の設定画面が非常にわかりやすく、データエンジニア以外のメンバーも容易に触ることができる点です。SQLさえ書くことができれば、追加の教育は不要でした。
導入後の効果
「データ分析基盤システム運用コスト」」を50%削減。データ連携のリードタイムもなくなった
鳩 :マネージドサービスなので、運用コストをものすごく低くすることができました。リプレイス前の構成では、分析基盤の保守・運用にデータエンジニアが何人も張り付かなければいけない状態でした。しかし、TROCCO®︎導入後はもう専任で付いているエンジニアはいません。TROCCOを使ったデータ収集の運用工数は、0.1人月にも満たないです。これまで分析基盤の運用にかけていた工数のうち少なくとも50%は削減できていると感じます。
また、データ連携のリードタイムがなくなりました。これは、SQLがかけさえすれば、エンジニアでなくてもTROCCO®︎を使用してデータ連携できるためです。以前はデータアナリストが新しいデータ分析をしたいときは、データエンジニアに依頼をし、データを連携・抽出をしてもらう必要がありました。TROCCO®︎導入によって、アナリスト自身がデータを連携・取得することができるようになり、分析スピードも向上しています。
鳩 :サポートが手厚いと感じました。問い合わせへの回答は非常にスピーディでしたし、Embulkのプラグインも迅速に追加いただきました。また、要件に合わせた機能拡張の検討も一緒にしていただき、助かっております。
また、ジョブ実行APIが解放されていて、既存のCloud Composerと合わせて使えたことが、分析基盤を一から作るわけではなかった当社にとって、非常にマッチしました。
データドリブンな意思決定を支える組織文化とその中の「TROCCO®︎」の役割
鳩 :一つは、関係者全員が一人残らずデータを見ていることでしょうか。BI上のダッシュボードで重要なKPIは全て見られる状態にしており、いつでも誰でもアクセスすることが可能です。slackには、レポート専用のチャンネルがいくつもあり、毎朝そのチャンネルにBIレポートが送られます。データを見る環境が整備されており、「朝起きてまずデータを確認する」という癖が全員についています。環境が整っているからこそ、データが非常に身近になり、会社の共通言語として使われます。そして、全員の数値感覚が磨かれ、データ活用に繋がっていると思います。
井立 良子様(以下、敬称略):もう一つは、社内に展開しているデータが信用できるということです。
「データの欠損はないか」「最新のデータになっているか」といったデータの正確性と鮮度が保証されて初めて信用されるデータになります。データドリブンな組織文化を築くためには、データが信用できることが大前提です。その観点で、データ分析基盤チームが非常に重要な役割を担っています。そこのチームの運用工数を下げているのが、TROCCO®︎です。エラーが少なく運用コストを低くするTROCCO®︎は、弊社のデータドリブンな文化を支えています。
今後の展望
井立 :新しいサービスの開発も進んでいますし、プロダクトが増えてきているので、タクシーアプリ「GO」だけでなくその他プロダクトでもTROCCO®︎を活用していき、全社でのデータ活用をさらに加速させていきたいと思っています。
データ分析基盤の構築・運用は
TROCCO®️におまかせ。
ETL/ELTパイプライン構築やワークフローなどを、SaaS上で実現。データエンジニアの工数を削減して、分析やクリエイティブな業務に集中しましょう。
製品資料をダウンロード