頻発したエラーを解消し、浮いたリソースを分析業務やAI活用へ。データ基盤構築で見えた可能性とは
株式会社ベーシック
- 課題
- データ取得のために本番用のデータベースへ直接クエリを投げていたため、データベースへ負荷がかかる可能性があった
- データ量の増加に伴い、データ加工や整形を行うツール、データプレパレーションツールでデータ転送した際にエラーが頻発した
- データ集約のために複数のツールを使用しており、運用コストや新しいメンバーが各ツールの使い方を習得するための学習コストが発生する可能性があった
- 目的
- データ活用のための適切な環境の構築
- プロダクトとマーケティング、決済のデータを集約したデータの可視化の実現
- 集約された顧客の行動データをもとにした、マーケティングや経営の意思決定
- 効果
- 多発していたエラーがほとんど発生しなくなり、エラー対応に割いていた平均月4時間を削減できた
- トラブルの発生箇所の特定やデータチーム内や経営層との意思疎通がしやすくなった
- データ基盤の構築と整理によってAI活用を前に進めることができた
「マーケティングとテクノロジーで問題解決する」を企業理念に掲げ、フォーム作成から入力後の顧客情報の管理までをワンストップで対応する「formrun(フォームラン)」や複数人の日程調整を効率化できる「bookrun(ブックラン)」などを開発、運営する株式会社ベーシック。同社の「formrun」「bookrun」は主にテックタッチでユーザーへアプローチしているため、プロダクトやマーケティングのデータを活用することは重要な要素だ。
同社のデータ構築推進グループでは、今回の取り組み以前にデータ基盤をすでに構築していたものの、データの加工、変換、転送に使用していたツールでエラーが頻発。この課題を解決するため、新たに「TROCCO®︎」を活用したデータ基盤を構築することになった。「TROCCO®︎」導入の背景にあった課題やETLツールの比較検討、データ基盤の活用状況、そして今後の展望について、ご担当者様にお話を伺った。
課題・問題
本番環境のデータベースからデータを抽出している状況に課題を感じ、データ基盤を構築
前川 智寿様(以下、敬称略):私たちの事業部が開発、運営している「formrun(フォームラン)」において、データ活用はマーケティング戦略で最も重要な軸です。
「formrun」はいわゆるホリゾンタルなSaaS型のビジネスモデルであるため、私たちの事業部にはフィールドセールスにあたるチームがなく、認知の獲得から契約、そして定着までの一連の流れのほとんどをテックタッチで進めています。
そのため、事業部の意思決定は「既存のユーザーがプロダクトをどのように活用しているのか」「どのように訴求すれば、見込み顧客に契約いただけるのか」といった顧客の行動データをもとに下されています。
前川:今回の取り組み前には、本番用のデータベースに直接クエリを書いてデータを抽出していました。この方法では、もし誤ってループする内容のクエリをデータベースに投げてしまうと大きなトラブルにつながります。やはりデータ基盤はしっかり構築しなければという意識が以前からずっとありました。
こうした背景からデータ基盤を構築するためにGoogle BigQueryを導入し、そこにプロダクトとマーケティング、決済の3つのデータを集約し、BIツールにデータを転送して可視化することになったのです。
なぜ「TROCCO®︎」を選んだのか
既存ツールの頻発する転送エラーや複数ツールを抱えるコスト面に課題感
飯塚 陽人様(以下、敬称略):「TROCCO®」を導入する以前は、1年ほど他社製のETLツールを複数使用してデータ転送をしていました。当時は転送するデータ量が少なく、使用する範囲も限定的だったため、BIツールとの親和性や連携を重視し、メインのデータ転送にデータプレパレーションツールを使用していました。
最初はうまくいっていたものの、サービスの成長とともにデータ量が増えたことで負荷がかかるようになり、週に1回程度の頻度で原因不明のエラーを起こすようになりました。データ転送でエラーが起きるとレポートが作成できず、マーケティングやプロダクトの担当者に迷惑をかけてしまいます。
また、対応するコネクタの関係で複数のツールを併用していましたが、コストの観点からひとつに集約すべきだと感じていました。運用上のコストはもちろん、今後新しいデータの担当者が入社した際に一つひとつのツールを学ばなければならないという学習コストがかかります。
そのため、本来はデータの加工、変換がメインの機能であるデータプレパレーションツールをETLのように活用するのではなく、データ転送のためのETLツールを導入すべきとの判断になりました。
飯塚:大きく2つの理由があります。1つ目が国内のサービスであり、日本語による導入後のサポートが手厚いことです。
今後の展望として、データを活用できる人材を積極的に採用していくことを考慮すると、国内のサービスであること、日本語対応したサービスであることはデータ転送業務の脱属人化を実現する上で重要でした。また、クリックするだけのGUI操作でやりたいことができること、視覚的に作業フローが分かりやすいことも、脱属人化の観点では重要だと判断しています。
前川:単純な費用という観点ではどのETLツールも大きな違いは感じられなかったため、データ転送業務の生産性で比較しました。データ転送業務の対応時間をどのくらい減らすことができるのか、それによってどのような業務に着手できるようになるのかは、定量的には測りにくいものの費用に対する生産性の向上の観点から比較検討しました。
こうした比較検討を経て、「TROCCO®」の導入を決定しました。
導入までのスケジュール・過程
ツールの分かりやすさとサポートが支えに。初心者でも1ヶ月かからず「TROCCO®」を導入
飯塚:以前利用していたツールからの乗り換え自体は1ヶ月もかからずに完了しています。運用が軌道に乗ってきてから、社内からの要望を受けながら一つひとつコネクタを繋いでいきました。私自身、人生で初めてETLツールを操作しましたが、何も困ることなく操作できているのは、「TROCCO®」の分かりやすさ、使いやすさゆえだと感じています。
飯塚:まずプロダクトの転送元データとしてはMySQLとPostgreSQLです。マーケティングの転送元データでは、一部の事業部で使っているSalesforceやHubSpotを、リバースETLで一部のデータはHubSpotに転送していました。
転送先であるデータウェアハウスのGoogle BigQueryへデータを集約し、その後にBIツールのTableauにデータを転送して可視化する、という流れです。
また、「TROCCO®」の機能ではワークフローを活用しています。データ転送の実行は現在ほぼワークフローで設定しており、特に経営判断に重要なデータは3時間に1回の頻度で転送しています。
飯塚:導入初期は担当の方のサポートのおかげで心配はほぼありませんでした。MAツールのデータ転送でなぜかエラーが頻発していたことがあったのですが、まずは相談してみるとすぐにお打ち合わせを設定いただき、そのお打ち合わせで無事に解決できたことが印象に残っています。
結局、MAツール側のAPI設定とリバースETL上の問題だったようで「TROCCO®」に対してだけでなく、転送元のツールについても深く理解されているなと感じました。
導入後の効果
頻発していたエラーを解決し、浮いたリソースでデータ分析やAI活用を前に進められた
飯塚:以前導入していたツールで多発していたエラーは、現在の運用上ではほとんど発生していません。プロダクト側のデータ転送ではエラーが発生しておらず、平均して月4時間ほどのエラー対応に割いていた工数を削減できました。また、もしデータ転送でエラーが発生しても、「TROCCO®」のSlack連携のおかげで通知が飛ぶようになっているため、確認漏れの心配はありません。エラー対応の工数削減によって浮いた時間は、データ分析や示唆出しといった事業により大きく貢献できる業務に費やすことができています。
データ基盤構築の成果としては、データフローをシンプルにできたことです。トラブルの発生箇所の特定、データチーム内や経営層との意思疎通がしやすくなりました。さらに主要なデータ転送を「TROCCO®」に集約できていますので、「TROCCO®」を確認すればデータフローの認識をすり合わせることができるのは、今後の引き継ぎや脱属人化という観点で有効です。
前川:事業、サービスレベルでのAI活用のアジリティは間違いなく低下していたでしょう。近日、世界中でAIサービスが勃興しています。いざAIを活用して事業やサービスに活かそうとしても、AIに学習させるためのデータが整っていなければ意味がありません。そこからデータを蓄積し始めても、AI活用に十分なデータはすぐには貯まらないでしょう。
まだ正式なリリースこそしていませんが、データ基盤の構築と整理によって弊社のAI活用のプロジェクトを前に進めることができたのは、「TROCCO®」を導入したおかげだと考えています。
今後の展望
AI時代のデータは企業の資産。データの資産価値を高めていくために必要なこと
飯塚:決済系をはじめ、いくつかのデータはまだ「TROCCO®」に集約できていないため、今後も引き続き必要に応じてデータソースを「TROCCO®」で転送し、集約していきたいと考えています。
あとはメタデータの管理ですね。業務の優先度の関係からメタデータの整備が後回しになっており、煩雑な状況になっているので、よりデータを活用しやすい環境を構築していければと思います。
前川:今後、データは企業の価値を左右するほどの重要な資産になっていくでしょう。そのデータの資産価値をさらに高めていくためにも、データを必要な場所へつなぎ、ビジネスに活かせる状態にしてあげることが大事です。今回導入した「TROCCO®」は、将来にわたってデータの価値を高めていくツールだと思っていますので、今後もしっかり活用していきたいですね。
前川:管理者の目線では、入社して日が浅い若手社員でも苦労せずに扱え、データに触れることができるツールは貴重です。自走してデータ転送業務に取り組んでもらえるのは助かります。
エンジニアは「いかに楽に仕事をするか」を常に考えて業務に取り組むべきです。仕事を楽にし、効率を上げ、そして若手に任せられる環境作りに、ぜひ「TROCCO®」を活用してみてはいかがでしょうか?