データ連携にかかる時間が1/10に!世界中の複合機やプリンターから届くデータを分析するため、京セラDSが取り組んだデータ分析基盤の構築
京セラドキュメントソリューションズ株式会社
- 課題
- GCPと社内ネットワーク間でデータ転送するには、インターネットを経由する必要があった
- 社内マスターデータから異種のデータベースへ連携する必要があった
- 構造化ファイルや半構造化ファイルなどへの対応も必要だった
- 目的
- 蓄積され続けるデータをデータ分析基盤に収集・分析できる状態
- 今後新しく出てくるデータベース製品にも対応できるデータ分析基盤の構築
- 様々な利用者がデータを分析できる状態
- 効果
- SQLの知識がなくても、比較的簡単にジョブを生成できる
- 社内のデータ転送に掛かっていた時間が1/10に
- 社内からのデータ転送依頼に対して、スムーズに対応できるように
「Put knowledge to work. (知識を仕事に活かす。)」というキャッチコピーを掲げ、複合機やプリンターの開発、販売を展開する京セラドキュメントソリューションズ株式会社(以下京セラDS)。グローバル規模に事業を拡大し続けている同社では、データに基づく経営の意思決定に課題を感じていたという。
世界中の複合機やプリンターから収集されるデータを効率的に統合し、BigQueryにデータを転送するために導入されたのが「TROCCO®」だ。取り組みの背景にあった課題や効果、データ活用における今後の展望についてお話を伺った。
導入のきっかけ
市場稼働機のデータを事業に活用したかった。社内データベースとGCPのデータ連携に課題感
西村 亮二 様(以下、敬称略):DX推進本部では、事業成長に必要なデジタルデータを収集、蓄積、利用できるシステムと、それを継続的に活用できるプロセスと体制を構築することを業務の一つのミッションとしています。このミッションを達成することによってDX推進を更に加速させ、効果を創出する人材を育成し、京セラDSの進化を実現したいと考えています。
大塚 祟生 様(以下、敬称略):弊社では2015年より、複合機やプリンターのリモートメンテナンスを行うために開発されたIoTシステム、KFS(KYOCERA Fleet Services)を運用しています。このシステムに接続されている機器の数は順調に増えており、デバイスの情報やアラート、カウンター(印刷枚数)、消耗品の状況、操作ログなど、大量のデータが蓄積されていきました。
しかし、もともとメンテナンス用にデータを収集するようにシステム設計されていたため、そのままのデータでは分析ができなかったのです。経営層や他部署からは、新製品の企画やサービス改善のためにKFSのデータを活用したいとの要望が届いており、例えばコロナ禍以降に世界規模で印刷枚数がどのくらい変化しているかといったデータをレポーティングしてほしいといった経営層からの要望もありました。
グローバルで100万台以上からデータを取得しており、なおかつ分析に適したデータの書式になっていないことから、データの集計に膨大な手間と時間が掛かっていました。そこでKFSと連携し、分析対象データを収集するデータ分析基盤の構築がすすめられることになったのです。
大塚:課題は大きく2つありました。1つは、GCP(Google Cloud Platform)とAWSで構築している社内ネットワークが接続されていないため、データ転送にはインターネットを経由する必要があったのです。
インターネットを経由したデータ転送に時間がかかると、社内要望に対してレスポンスが遅れてしまう可能性が高まります。そうした可能性を低減するためには、迅速にデータ転送ができる分析基盤であることが大前提となってきます。
もう1つの課題が、SQL Server内の社内マスターデータから異種のデータベースへデータ連携が必要だったことです。社内ではさまざまなデータソースを扱っているため、データソースに追加対応するためには毎回開発しなければならず……。
また、データ活用のためには、SQL Serverのようなデータベース以外に構造化ファイルや半構造化ファイルなどへの対応も必要でした。
導入・構築について
コスト、機能面でオンプレミス型と比較検討。クラウド型の「TROCCO®︎」導入の決め手とは
大塚:何もないところからデータ分析基盤を構築するということで、以下のような条件をまず設定しています。これらの条件を満たすデータ分析基盤を構築するため、ETLツールの導入を検討することとなりました。
・蓄積され続ける様々なデータをデータ分析基盤に収集・分析できること
・非構造化データの連携も考慮する
・様々な利用者が分析できる仕組みを導入する
大塚:「TROCCO®︎」の導入にあたっては、ETLとしてすでに歴史があるパッケージ製品との比較検討を行っています。その製品は、複数のデータベース製品に対応したコネクタがあるものの、オンプレミス型の設計であったため、今後出てくるであろう新しいサービスにどこまで適用できるかが不安でした。
また、製品の利用においては、ある程度のトレーニングが不可欠であり、体制やインフラを再設計するためにプロジェクト規模で取り組む必要がありました。
一方「TROCCO®︎」はSaaS型のクラウドサービスであるため、今後新しく出てくるデータベース製品にも対応できると判断しました。導入後すぐに活用できることも、クラウドサービスならではの強みだと思います。
また、直感的に管理画面を操作できるだけでなく、SQLの知識があれば容易にパイプラインを作成できることも高評価でした。私たちの部署は、Pythonをすらすら書けるエンジニアが在籍していないため、とても助かります。
大塚:比較対象のパッケージ製品は、初期導入に数百万円規模の投資が必要であること、定期的にバージョンアップする必要がある点がネックでした。また、この費用は固定資産の扱いとなるため、償却期間の間、固定費として計上されます。
「TROCCO®︎」の場合は、データ転送量に応じた従量課金であり、月額料金も「この金額で大丈夫なのか?」と心配になるほどでした。低コストで始められるおかげで社内の合意形成もスムーズに進み、社内のセキュリティチェックも問題なく承認が得られたため、「TROCCO®︎」の導入を決定しています。
大塚:もともとPoCの期間として2週間を設けており、その期間内で「やりたいことができている」という感触を掴みました。ですので、正式契約後に特別な設定をしたわけではありません。
中村:当初社内からは、分析の切り口としてKFSのデータを社内の製造系マスターデータと結び付けたいという要望がありました。そこで、最初に社内にある製造系データを「TROCCO®︎」でBigQueryにつなぎ込んでいます。
その際、操作に関する質問に対してご担当者にスッと回答をいただいたことを覚えています。アドバイス通りに操作したところ、無事につながりまして、素晴らしいご対応だなと感じました。
導入後の効果
データ連携にかかる時間が1/10に!より積極的に社内のデータ分析業務に貢献できるように変化
中村:つなぎ込んでいるデータ本数は20〜30本ほどで、2022年7月現在の累計転送量は60GB以上になります。
このデータ転送量は右肩上がりに増えていまして、データ活用の仕組みを社内向けにサービス化したことが背景にあります。社内イントラネットからアクセスすることができまして、具体的には私たちの部署が仲介してBIツールを現場に提供してデータを可視化したり、データ活用に関する社内教育を展開したりと、DX推進の役割を担っています。
大塚:社内のデータベースから、クラウドサービスへのデータ転送が短い時間でできることが特に高評価です。社内SQL Serverの5.6GB(5,000万件)のテーブルをBigQueryへ転送する場合、たったの35分しかかかりません。しかも、他社製品のようにサーバーにモジュールや機能を組み込む手間もありません。
その他には、社内で利用している主要製品やクラウドサービスにもコネクタが対応していること、スケジューラー機能で定期実行が簡単であることも評価しているポイントです。また、「TROCCO®︎」のAPI機能を利用し、社内のジョブ管理製品からシームレスにデータが取り込める点も高く評価しています。
石田:SQLの知識がなくても、比較的簡単にジョブを生成できる点も嬉しいですね。印象的なエピソードとして、工場に蓄積されていたデータをBigQueryに転送してほしいという社内からの依頼に「TROCCO®︎」を活用したケースがあります。
正直、1日では絶対に無理な依頼だと思っていたのですが、「TROCCO®︎」を活用したことで、実質2、3時間ほどしか作業に時間がかからなかったのです。これは想定時間のおよそ1/10です。
もし「TROCCO®︎」がない状態であれば、まずはジョブ化して数GBのCSVを時間をかけて吐き出し、それをクラウドにアップロードしていくという手間も時間もかかる方法を取るしかありません。
中村:もともと弊社のWebのシステムはSQL Serverなのですが、以前の場合はデータ分析したいと思ってクエリを投げても返ってこないケースがしばしばありました。そうなると社内からの依頼があっても時間がかかってしまうだけでなく、場合によっては断らざるをえないことも。
しかし「TROCCO®︎」の導入後は、「とりあえずBigQueryに移してみて考えよう」とサッと対応できるようになり、より積極的に社内のデータ分析業務に貢献できるようになりました。これは私たちの部署だけでなく、社内全体としても革新的なことだと思います。
今後の展望
目指すは「データの民主化」。データ分析の質とスピード感を上げ、意思決定に貢献したい
西村:私たちの部署では「データの民主化」を目指しています。データを加工するだけで何時間、何日もかかっていたのでは民主化は進みませんし、社員の負荷を減らしていくことも重要です。スピード感、品質も含め、しっかりデータ活用できる社内体制の構築を進めていきたいと考えています。
そして最終的には、現場のマネージャーや経営層がデータをもとにスムーズに意思決定できる状態を目指していきたいですね。
大塚:弊社では、業務部門におけるAI/IoTを活用したDXへの取り組みの進化と加速を支援するサービスとして「KDC AI/IoTサービス(AISEA)」を社内に向けて提供を開始しました。
データ収集から利活用までの一連の流れにおいて、以前は細かい業務ごとに分割していたためにユースケースがまとまらず、AI/IoTの社内浸透に課題を感じていました。そこで以前はバラバラに提供していた業務を、「データを『取得する』『つなげる』『蓄積する』『加工する』『分析する』」の5つのSTEPに分類し、それぞれのサービス内容を定義、「AISEA」としてサービスメニュー化しました。このうち、『つなげる』部分で「TROCCO®︎」が重要な役割を担っています。これによって社内DXをさらに推進、強化していき、長期的な経営戦略・ビジョンの実現につなげていきたいと考えています。
中村:以前、企業のデータ分析担当者が集まる関西圏のコミュニティに参加してみたのですが、データをいかに活用するかに主眼を置いている企業が多いように感じました。確かに活用は大事ですが、その前工程であるデータ収集と基盤作りにも、しっかり投資をしていくべきです。
データを扱ってはいるけど、データ分析基盤に手を付けられなかった企業こそ、ぜひ「TROCCO®︎」を触ってほしいという思いがあります。
大塚:私たちも、データ分析基盤の構築にあたってもともとはインフラとデータベースの知識だけでしたが、最大のネックであったデータ収集の仕組みを「TROCCO®︎」を活用することでスムーズに実現することができているため、まずは恐れず一歩踏み出してみてはいかがでしょうか。
京セラドキュメントソリューションズ株式会社
https://www.kyoceradocumentsolutions.co.jp/
業種 | 精密機械 |
---|---|
設立 | 1934年11月 |
従業員数 | 24,337名(2022年3月末時点) |
事業内容 | 事業内容:複合機、プリンター、インクジェットプロダクションプリンティングシステム、ドキュメントソリューション、アプリケーションソフトウェアおよびサプライ製品の開発・製造・販売 |