何時間もかかっていたデータ処理をたった10分に!データを活かしたコンサルティングを支えるデータ基盤とは
株式会社ナレッジハンズ
- 課題
- PCでは対処が難しいサイズが大きいデータを扱うためにデータ基盤を構築する必要があった
- 2年ごとに行われるデータの改定を想定し、柔軟な構成が必要だった
- BIツールは使えていたが、前処理に使われていたコードはメンテナンスが困難な状態であった
- 目的
- 容量の大きいデータの取り込み時間の削減
- 得手不得手を問わず、すべてのコンサルタントがデータを活用できる状態
- 属人化せず、継続的にデータ基盤を運用できている状態
- 効果
- 前処理や読み込みだけで場合によっては何時間もかかっていたが、取り込みを依頼した10分後にはデータ分析が始められるように
- データ分析や現場改善などコンサルタントの本来の関心事に注力できるように
- コンサルタント全体のデータへの関心と分析レベルが向上
「現場主義」「データ活用」のキーワードを企業理念に掲げ、日本全国の病院へのコンサルティングサービスの提供や、自社による医療機関や介護事業所の運営、さまざまな新規事業を展開する株式会社ナレッジハンズ。
同社にとって中核となる病院への経営改善支援では、病院から提供される診察や投薬に関するデータを活用し、膨大かつ詳細なデータ分析を行っている。コンサルタントが経験に加えてデータに基づいた改善ができる背景には、「TROCCO®︎」を活用したデータ基盤による貢献がある。「TROCCO®︎」導入の背景にあった課題やETLツールの比較検討、データ活用における今後の展望について、ご担当者様にお話を伺った。
課題・問題
病院から提供されるEFファイル等のDPCデータを分析。運用の継続性とデータ基盤の構築に悩み
瀬戸口 光宏様(以下、敬称略):医科保険の診療行為の内容、具体的な薬剤や診療材料が記録されたEFファイルなどを含むDPCデータ(Diagnosis Procedure Combination データ、診断や治療に関するデータ)を主に扱っています。匿名化された患者さんひとりひとりのデータが詳細に記録されており、医療従事者や薬剤といった医療資源の投入量の分析に役立てることができます。
DPCデータは数ヶ月おきに厚生労働省へ提出するテキスト形式のデータで、入院1日で患者さん1人あたり数十行の情報が記録されています。たとえば、数百の病床を有する大きな病院の場合だと、たった1ヶ月だけで1GBものサイズになることもあり、Excelなどで開くだけでも時間がかかってしまいます。
瀬戸口:弊社がおよそ30病院のお客様からお預かりしているデータはEFファイルだけで5億行前後です。サイズ自体はそれほど大きくなく、100GBほどです。
これらのデータをお客様の支援に活用するには、まずデータを可視化させる必要があります。しかし、私が入社する以前はデータ可視化までのフローが整っているとは言えませんでした。前処理に使われていたコードはメンテナンスがしにくく、私が一部を書き直したところでうまく更新できないと判断しました。
そこでGoogle BigQueryとBIツールのLooker Studioを新たに導入することを決定しました。
瀬戸口:DPCデータの内容や様式は厚生労働省が指定するものであり、2年に1度その内容が大なり小なり変更されます。そのため、DPCデータを活用したデータ基盤の構築にあたっては、2年おきにデータの項目を含めて変更があることを想定しなければなりません。
またDPCデータの改定のたびに過去のデータと整合性が取れなくなると、正しい分析に支障をきたしますので、改定前後のデータをうまく連続させる必要もあります。以前運用していたフローでは、ここがかなり難しいものでした。
別の課題としては、私一人でデータ基盤を構築しなければならないことも挙げられます。データを扱うチームには3〜4名が在籍しているのですが、私以外の全員がコンサルタントを兼任しているため、どうしてもコンサルティング業務が優先されます。こうした課題を解決するため、前職のデータ活用でも触れていたETLツールの導入を検討することになりました。
なぜ「TROCCO®︎」を選んだのか
文字コードがShift_JISのため、国産ツールを選定。「いいプロダクト」の条件とは
瀬戸口:オープンソースのETLツールや海外製のETLツール、そして「TROCCO®︎」を比較検討しました。
オープンソースのETLのツールはデータ基盤の構築に手間と時間がかかってしまうこと、海外製のETLツールは日本語データに最適化されていないことから、それぞれ選定から外しました。お客様である病院から送られてくるDPCデータの文字コードはShift_JISであるため、どうしても欧米系ツールとは相性が悪かったのです。将来の社内のメンバーがツールのサポートを受けることを考え、データを転送するツールも国産ツールであるべきと判断しました。
瀬戸口:国産ツールであることに加え、「いいプロダクト」だなと感じていたことが決め手です。必要な機能が備わっていると感じました。たとえばGoogle BigQueryにデータを転送するだけでなく、「TROCCO®︎」からGoogle BigQueryにアクセスできます。そのためデータレイク層のデータを加工し、Google BigQueryにデータウェアハウス層やデータマート層への格納するSQLの実行環境として利用できます。
また、ユーザーからの機能要望に対してしっかり検討いただいている実感があります。私も前職でSaaS事業に携わっていたので、ユーザーからの要望に優先順位を決めて対応していくこと、ユーザーとの接点を作っていくことの大変さをよく理解しています。担当の方にプロダクトアップデートを教えていただいたり、機能要望を含めたコミュニケーションの機会をいただけたりと、ユーザーにとても寄り添っているように感じます。
瀬戸口:まずはフリープランでお試し導入させていただきました。
当初はフリープランの処理時間枠で毎月のデータ処理が済んでいたのですが、元データや設定を見直していると、病院や月によって見出し行があったりなかったりなどの細かな違いが存在することに気が付きました。これらの差異をひとつひとつ設定してデータを入れ直していくと、フリープランの処理時間枠には収まらないことが判明したのです。
そこで社長に対し「アルバイトを雇って人件費をかけるよりも、『TROCCO®』を導入するほうが安価に抑えることができる。また有料プランにすることでより多くのデータを投入することができる。」と伝えたところ、二つ返事で合意を得ることができ、「TROCCO®︎」の有料プランへの移行が正式に決定しました。
導入までのスケジュール・過程
データの格納、転送、可視化をクラウド化し、現場経験とデータを組み合わせた提案が可能に
瀬戸口:病院から共有いただいたテキスト形式のDPCデータをBoxへ格納、その後にGoogle BigQueryに転送し、Looker Studioで可視化するというデータ基盤は、フリープランで活用していた頃にはほとんど構築できていました。有料プランへの移行後は、データ転送にかかる時間を気にする必要がなくなったため、長い期間分のデータの投入や、より高頻度なデータの差し替えが可能となりました。それに伴い病院ごとの比較や差異の検証など、分析業務の幅が広がったと感じています。
結果コンサルタントが自身の経験だけでなく、他病院のデータからも知見を得て、お客様の支援ができるようになったのです。
瀬戸口:特に大きな病院は、ご提供いただくDPCデータのサイズも大きくなるため、データ形式の不備やGoogle BigQueryの不調でデータ転送に失敗してしまうことがあります。有料プランに移行した現在は解決できていますが、処理時間枠が制限されているフリープランを最大限活用するには、Google BigQueryへ投入すべきファイルを適切な場所に置くこと、データが重複してしまうことを防ぐ必要があります。
そこでデータが漏れていたり、重複していたりとデータ転送にエラーが起きてしまいそうな場合は、「TROCCO®」の転送ワークフローやHTTPリクエストを活用して事前に気付ける仕組みを用意することにしました。詳しくは以前に私のnoteにまとめた記事である『trocco を使った Box から BigQuery への冪等データ投入への道』に書かせていただきました。
導入後の効果
コンサルタントが何時間もかけて対応していた業務がたった10分に!お客様への提供価値も向上
瀬戸口:「TROCCO®」を活用したデータ基盤を構築したことによって、これまでコンサルタントが分析の前処理にかけてきた時間がはるかに下がったはずです。今回の取り組み以前は、定期的な報告に向けた分析のために巨大なCSVデータを読み込んでいました。場合によってはそれだけでずいぶん時間がかかっていたそうですが、ほんの10分程度になりました。
時間をかけて前処理の作業をする必要がなくなったということは、各コンサルタントが本来するべきである病院の分析や改善に注力できるようになります。コンサルタントがより深く案件に関わることができるようになり、お客様への提供価値は高まったと感じています。
瀬戸口:以前は限られたコンサルタントしかBIツールのダッシュボードの作成や操作ができず、データをフルに活用したコンサルティングにはまだまだ課題が多い状態でした。
しかし「TROCCO®」の導入をはじめとしたクラウドベースのデータ基盤の構築によって、今ではすべてのコンサルタントが自身のPCで膨大なデータにアクセスできるようになり、コンサルタント全体のデータへの関心と分析のスキルが上がったと思います。病院の現場に入り込んだ提案と、データを活用した提案を組み合わせることでより効果的な経営改善への支援ができるようになったのではないでしょうか。
今後の展望
病院側の担当者も閲覧できるダッシュボードで、病院の意思決定に貢献したい
瀬戸口:DPCデータを活用したデータ基盤とダッシュボードは、社内のコンサルタント向けにしか提供していませんでしたが、現在は病院側の担当者も閲覧できるようなダッシュボード開発を進めています。
弊社の病院経営コンサルティングとは矛盾するサービスのように感じるかもしれませんが、医療現場と病院経営を改善することが弊社の目的です。病院の経営陣自らがリアルタイムでデータを確認し、意思決定できるようになることは間違いなく必要だと思います。
加えてDPCデータ以外の、診療報酬を請求するためのシステムであるレセプトコンピューター(レセコン)や電子カルテに記録されているデータの活用にも取り組んでいきたいですね。
瀬戸口:自分だけの力とプログラミングですべてを解決するのではなく、使えるサービスやツールがあれば積極的に活用したほうが、結果的にコストを抑えられるはずです。特にデータ基盤については、専門的な知識が必要なだけでなく、構築後の継続的な維持も重要な要素です。だからこそ、データを重視する企業で多く採用されている「TROCCO®」のようなサービスやツールを積極的に活用すべきだと思います。みなさんもぜひ「TROCCO®︎」を使ってみてはいかがでしょうか。
株式会社ナレッジハンズ
https://www.knowledgehands.com/
業種 | コンサルティング業界 |
---|---|
設立 | 2010年6月 |
従業員数 | 24名(2024年7月現在) |
事業内容 | 事業内容:経営改善支援、人事制度構築支援/組織開発、M&A 支援、医療機関・介護事業所運営、キャリア支援「RIKEJO CAFE」運営、組織診断システム「halo」の開発・運営 |