株式会社primeNumber(本社:東京都目黒区、代表取締役CEO 田邊 雄樹)は、データ統合自動化サービス「trocco®(トロッコ)」の新機能として、「メタデータ管理機能」のメイン機能となる「データカタログ機能」をリリース致しました。



「データカタログ機能」追加の背景

「trocco®」は、ユーザーの持つ膨大かつさまざまな種類のデータを、自動で企業のデータ基盤へ統合するクラウド型サービスです。企業はこれらのデータを分析することで、自社のビジネス成長に繋げることができます。

「メタデータ」とは、データの意味・状態・依存関係といったデータに付随する情報のことです。分析者がデータを理解したり、素早く正確に分析するためには「メタデータ管理」が非常に重要で、企業が活用したいデータ量が爆発的に増えると共に注目を集めています。一方、支援サービスは少なく、多くの企業は未だに手作業で管理を行っています。

そこで2021年7月に、「メタデータ管理機能」の第一弾として、データエンジニアに向けた「データリネージ機能」を追加いたしました。本機能によりデータエンジニアは、障害発生時に影響範囲を迅速に確認したり、分析基盤の全体像を簡単に把握・共有したりすることができます。

今回は第二弾として、データサイエンティスト・アナリスト等の分析者に向けた「データカタログ機能」を追加いたします。本機能により分析者は、データ集計を効率的に行うことができます。

「データカタログ機能」とは

データの集計・分析を行う際には以下の5ステップが必要になります。

1:分析要件の整理
2:データの選定
3:データの理解
4:集計の実行
5:集計結果の確認

従来この5ステップは非常に手間のかかる作業でしたが、データカタログ機能は2~5の4ステップをサポートし、データ分析者が集計作業を効率的に行えるようにいたします。

「データカタログ機能」 5つの仕組み

1:データ検索
「データの選定」を効率化する仕組みです。キーワードで検索することで、自身の必要なデータがどのテーブル(※)・列にあるのかを探すことができます。

(※)データを格納する領域のこと。表形式で表されます。



2:ER図
「データの選定」を効率化する仕組みです。データの所在地とデータ同士の依存関係を可視化します。自身の必要なデータがどのテーブルにあるのか、ER図を見ながら探すことができます。



3:メタデータおよび統計データ表示
「データの理解」を効率化する仕組みです。「データの選定」で発見したテーブルの中に入っているデータそのものやメタデータ、および統計データ(※)を確認することができます。一例としては、テーブルの列名に対して、Salesforceの日本語項目名も紐づけた上で、データを理解できます。

(※)データのバリエーション数や欠損数といった、データの性質を表す数値



4:JOIN分析
「データの理解」および「集計の実行」を効率化する仕組みです。2つ以上のテーブルを結合した上でデータを取り出す必要がある場合、テーブル同士の関係をベン図で確認することで、どの集合(JOIN方式)を選ぶべきか判断することができます。



5:クエリエディタ
「集計の実行」「集計結果の確認」を効率化する仕組みです。分析者はDWH(データウェアハウス)というデータの保管庫側でクエリ(データベースエンジンに対する処理要求)を書いて集計を行うことが多いですが、本機能によりtrocco®上でテーブル・カラムメタデータを参照しながらクエリを書くことができます。また、統計データを参照して欠損値やデータの分布を確認したり、昇順・降順で並べ替えたり、フィルタをかけたりしながら、集計結果の精度を確認することができます。



「データカタログ機能」 今後の展望

「データカタログ機能」今後の展望は下記の通りです。

・「クエリエディタ」のアップデート(クエリの自動補完や自動修正提案を追加予定)
・「クエリカタログ」の追加(他の人が書いたクエリ一覧からお手本となるクエリを探すことができる)
・「ビジネスグロッサリー」の追加(ビジネス用語や重要経営指標などの定義を記載した辞書を作成できる)

データ統合自動化サービス「trocco®」とは

「trocco®」は、ユーザーの持つ膨大かつさまざまな種類のデータを自動で統合し、データ活用を効率化するクラウド型サービスです。

多くの日本企業にとってデータ活用は喫緊の課題です。しかし企業が活用したいデータは、大容量で形式も様々、かつ複数の場所に散らばっているため、まずは「統合」する必要があります。一方、多くの企業において、希少なエンジニアが「データ統合」を手作業で行っており、非効率的です。こうした課題を解決するのが「trocco®」です。

「trocco®」はデータ統合を自動化し、工数の約9割を削減することで、エンジニアがより戦略的な業務に集中することを支援します。また、統合時間も削減できるため、企業は営業やマーケティングといったビジネスの意思決定に、データを素早く活用することができます。

URL:https://trocco.io/lp/index.html

株式会社primeNumber 会社概要

我々は、「あらゆるデータを、ビジネスの力に変える。」データテクノロジーカンパニーです。データが爆発的に増えていく時代に、誰もがすばやく、簡単にデータを使える環境を構築し、データ活用までのプロセスを最適化。高度なテクノロジーと独自のアイデアで、世界中のビジネスを支援します。

<会社名>
株式会社primeNumber(英文名:primeNumber Inc.)
<代表>
代表取締役CEO 田邊 雄樹
<設立>
2015年11月
<オフィス>
東京都目黒区下目黒2-20-28 東信目黒ビル7F
<企業サイト>
https://primenumber.co.jp/
<事業内容>
データ統合自動化サービス「troccoⓇ」の開発・運営
汎用型データエンジニアリングPaaS 「systemN ™」の開発・運営
データ活用伴走支援型ソリューション

本リリースお問い合わせ先

株式会社primeNumber
コーポレートコミュニケーション室 広報担当 村島夏美
e-mail:[email protected]

「trocco®」お問い合わせ先

https://trocco.io/inquiry/new