株式会社スマートエデュケーション様には、2019年7月より分析基盤向けデータ統合サービス「 TROCCO®」(トロッコ)をご活用いただいております。CTO谷川裕之様に、事業内容から分析基盤の構築とその活用方法についてお話を伺いました。(聞き手:株式会社primeNumber 取締役執行役員CPO 小林寛和)
スマートエデュケーションについて
親子で一緒に楽しめる知育アプリを全世界に展開
谷川様(以下敬称略):スマートエデュケーションでは、「TO-FU おっ!すし屋さん」や「こどもモードKitS アートポン!」など、親子で遊べる乳幼児やお子様向けの教育・知育アプリの企画・開発を行っています。私は創業当時から9年半ほど関わっており、現在はスマホが中心ですが、以前はガラケーなどのモバイルアプリも扱っていました。
当社には、「世界中の子ども達がいきる力を育む」一助となる“知育アプリ”を提供するというビジョンがあります。画一的な教育ではなく、色々な教育の選択肢を与え、子ども自身の可能性に気づいて欲しいという思いで知育アプリを提供しています。
谷川:親子が一緒に楽しめるアプリを作るということです。親子が一緒に絵本を読んだりすることでコミュニケーションの促進にもつながると信じ、創業当時から「親子で○○」というアプリを沢山作っています。
また、未就学児をターゲットとする当社の知育アプリでは、言語に頼らずに五感に訴えるものが多いのが特徴です。そのため言葉の壁を超えて全世界に展開することが可能です。五感を刺激するために、本物の楽器の音・プロ歌手の歌・プロナレーターの朗読を採用するなどのこだわりがあります。
谷川:これまでリリースしたアプリの累計ダウンロード数は4000万を超え、ほぼすべてのアプリが122以上の国と地域でリリースされています。
分析ユースケース
アプリの利用状況分析から、レベニューシェアの計算まで
谷川:分析基盤では、主にアプリの継続状況や子供達がどのようにアプリで遊んでいるのかを見ています。例えば「このボタンタップを子どもたちが理解しているか」などのログを取っており、使われていない機能の確認などに利用しています。
谷川:サービス開始初期の頃に、これらの分析で子供達にはドラッグやピッチイン・アウトの操作を行うのが難しいという事が分かりました。そこでより簡単なタップ操作に切り替え、ユーザビリティを向上しました。
谷川:経営的な観点からは、売上とポテンシャルのどちらも重要視しています。
一方事業運営の観点では、継続率を見ています。課金率は、今では大体予測できるため追わなくなりました。
特にサブスクリプション課金型のアプリでは、「月を跨いだ時にどのくらい継続して課金されているか」や、「無料から有料に切り替わるタイミング」などを注視しています。
谷川:一言に継続率と言っても、アプリを継続利用しているかという観点と、アプリ内で新しいコンテンツを利用してくれているかという観点があり、それぞれログを取っています。一般的なユーザーは、サブスクリプションプランを購入し、継続してアプリで遊び、毎月の新しいコンテンツが出たらそれをプレイするような流れになりますが、それぞれのタイミングでログを取っています。
谷川:たとえば、子どもは習慣的に行動し、毎週土曜日の朝に当社のアプリで遊ぶ子どもが多いという仮説を立て、それらの予測が狙い通りかというのを見ています。毎日遊んでくれれば良いというゲームとは大きく異なり、細く長く遊んでもらえているかという観点で分析を行っています。
谷川:はい。例えば以下のようなデータを、BigQueryにデータ統合しています。
- アプリ内で利用している楽曲・コンテンツ(ライセンス契約済み)のマスタデータ
- 上記のライセンスフィーに関するデータ
- AppStoreやGoogle Play Store、その他プラットフォームでの売上データ
- スプレッドシートで管理しているデータ
アプリ内で利用しているライセンス契約済の楽曲等は、ライセンスフィーが発生しますが、フィーに関するデータもBigQueryに集約しています。
特殊な例だと、dキッズなどのキャリア向けプラットフォームはメールベースでPDFで売上が届くので、それらをスプレッドシートにまとめ、スプレッドシートからTROCCO®経由でBigQueryにまとめるような転送ケースもあります。
分析基盤のアーキテクチャについて
RDBやRedshiftを試すも課題があり、最終的にBigQueryを採用
谷川:弊社にとって、BigQueryは4世代目の分析用データベースになります。過去にはMySQL、MongoDB、Redshiftなどを試してきましたが、運用コストが高かったり、パフォーマンス要件を満たさないなどの問題があり、BigQueryに落ち着きました。
谷川:弊社の分析基盤では、提携パートナーとのレベニューシェアレポート作成などを行っているのですが、そのデータ量や計算量が非常に多いユースケースがあることが特徴です。そのため、クエリの実行時間が長すぎたり、DB側の負荷が高すぎるなどの問題がありました。
そこで中間サマリーデーブルを作るなどの工夫を凝らしましたが、どこが違ったのかすべて確認しないといけないため、今度は運用負荷が上がってしまいます。BigQueryだけがこのような問題が発生することなく、高速かつ安定した運用を実現できています。
谷川:基本的なKPIはスプレッドシートなどで可視化しています。弊社には元SEが多く、基本的にSQLを書けるため、BigQueryに直接SQLを実行をして探索的な分析を行ってもらうケースもあります。また分析用途だけでなく、弊社では絵本作家など色々な人とコラボしているので、その辺りのロイヤリティやレベニューシェアなどを管理しています。
TROCCO®導入の経緯
Embulk運用はマネージドサービスに任せ、本業に集中
谷川:導入以前はジョブ管理ツールとしてRundeckを、データ転送処理はOSSのEmbulkを利用してデータ統合を行っていました。全て自前構築したサーバー上で動かしていました。私の前任者の退職にあたって引き継ぎを行っていたのですが、これらの仕組みの運用工数が高いと感じ、マネージドサービスを探し始めたのがきっかけです。
谷川:分析基盤構築とデータ統合自体は行えていたのですが、Embulkのアップデートやエラー対応等の工数が高く、課題となっていました。当社は人数が少なく、本業のアプリ開発以外の業務はマネージドサービスを使う文化がありました。そこでデータエンジニアリング周りについてもプロに任せ、本業に集中したいという思いがありました。そこで海外サービスも検討しましたが、国内のサービスではTROCCO®しか見つからず、検討を開始しました。
谷川:当社も無料トライアルを利用し、導入前の技術検証等を行いました。検証の結果、ほぼ全ての転送パイプラインがTROCCOに移行出来て運用工数が軽減できることと、サポートが丁寧だったことから導入に至りました。
[interviewer] TROCCO®を導入して、一番メリットだと感じたことは何でしょうか。谷川:TROCCO®を導入前は、データエンジニアリング業務が属人化していました。TROCCO®を導入したことで、複雑だった運用が画面上の設定だけで完結できたため、とにかく楽になりました。もちろん安定運用していることもメリットです。
TROCCO®の稼働までの期間は約半月で、設定追加もカジュアルに行えるようになり、気持ちも楽になりました。あと、いつも機能追加が早くて驚きます!
今後の展望について
谷川:今後は保育園向けのアプリなど、toBの事業に力を入れていきたいと考えています。
さらに、単なるモバイルアプリではない領域にチャレンジしたいと考えており、例えば子ども向け施設でのIoTデータ活用も視野に入れております。IoTの取り組みということで、データという観点では、デバイス等のデータについてTROCCO®にお手伝いいただけたらいいなと思っています。
データ分析基盤の構築・運用は
TROCCO®️におまかせ。
ETL/ELTパイプライン構築やワークフローなどを、SaaS上で実現。データエンジニアの工数を削減して、分析やクリエイティブな業務に集中しましょう。
製品資料をダウンロード