BigQueryにデータを揃え、最新のAIを導入した。それなのに、分析を頼んでも期待した答えが返ってこない。こうした壁に突き当たっている企業が増えています。AIブームの裏側で浮き彫りになったのは、データの量ではなく、データの意味を教えるナレッジの不足でした。AIがデータを理解するプロセスから、カタログが求められる理由を紐解きます。

1. AIは会社のルールを知らない新入社員

AIの言語能力やコード生成能力は目を見張るものがありますが、組織固有の暗黙知や集計定義までは持ち合わせていません。

BigQueryにあるのは、数字や文字列が並んだ素材としてのデータです。一方で、どのフラグが有効か、KPIをどう計算すべきかといった情報は、社員の頭の中にしかない「業務ナレッジ」です。熟練のアナリストはこのナレッジを理解しており、新入社員が入れば、プロダクトの受注定義やフラグの特性を教えて導きます。

この、アナリストが持ち、新入社員へ伝えるべきナレッジこそが、データの世界でメタデータと呼ばれるものです。メタデータがない状態でAIに分析をさせる行為は、マニュアルを渡さずに新人に丸投げする状況と変わりません。

そして、データカタログではこのメタデータが「項目の説明 = コンテキスト」として機能します。

2. AIが正確な回答に辿り着くまでの道筋

AIが質問を受けてからSQLを書くまでの流れを見ると、データカタログが常に参照先として機能していることが分かります。

まず、AIは質問に含まれるLTVや有効商談といった言葉が、その組織でどう定義されているかを確認します。このロジックの理解がすべての起点です。教科書に計算式がなければ、AIは一般的な解釈に頼り、自社とは異なる計算を始めてしまいます。

ロジックを掴んだAIは、次に必要なテーブルやカラムを特定します。説明文が添えられていれば、売上合計にはこのカラムを使うべきだといった判断を下せます。

最後に、データの特性を読み取ります。ステータスコードの数値が何を指すのかといった詳細を把握することで、現場でそのまま使える回答を出せるようになります。

3. データカタログとメタデータの有無で変わる挙動の差

売上金額(amount)、注文状態(status)、顧客区分(type)といったカラムを持つテーブルを例に、具体的な差を見てみましょう。

ユーザーの質問データカタログ(メタデータ)がない場合ある場合
先月の確定売上を教えてamount カラムを単純に足し合わせます。キャンセル分(status=’canceled’)まで含めてしまい、誤った数値を算出します。確定売上とは status=’completed’ のもののみを指すという定義を参照し、正しい条件で集計を実行します。
LTVの高い順に並べてLTV というカラムを探すが見つからず、回答不能になるか、単なる合計金額で判断します。amount の合計から割引額を引くといった具体的な計算方法を読み取り、集計を完遂します。
法人顧客は誰?区分フラグ(type)の数値が何を指すか分からず、推測で答えるしかありません。数値の 1 が法人、2 が個人といった注釈を読み取り、正確にデータを抽出します。

4. メタデータをナレッジとして蓄積する場所の選択肢

BigQueryユーザーがこれらの情報を管理する手段として、DataplexとCOMETAが挙げられます。

Google Dataplexは、ビジネス用語をデータ資産に紐付けるGCPの標準機能です。インフラに近いレイヤーで統制を効かせたい場合に適しています。

対してCOMETAは、現場での運用やAIへの渡しやすさに重きを置いています。専門知識がなくてもメンテナンスしやすい画面を備えており、組織特有のKPI定義やプロダクト情報を柔軟に一元管理できます。AIへ業務ナレッジを届ける集約拠点として機能します。

(COMETAの「用語集」、AIに業務ナレッジのコンテキストを届ける)

5. AIを教育してデータカタログを育てる視点

実際にCOMETAを活用している現場では、興味深い手法が実践されています。あえてAIに分析を依頼してみて、答えられない部分を炙り出す方法です。

AIが答えに詰まった場所こそがメタデータの不足している箇所であり、同時に人に対しても伝わっていなかった暗黙知でもあります。

AIを最も手のかかる新入社員に見立てて教え込む。そうして言語化された業務ナレッジ文書は、人間にとっても最高のドキュメントとなり、組織の属人化を解消する近道になります。

まとめ

データカタログは、単なる検索ツールではありません。AIに知恵を授け、精度を支える業務ナレッジの供給源です。

BigQueryを組織の知性として機能させるために、まずはAIが迷っているポイントを用語集で埋めることから始めてはいかがでしょうか。その積み重ねが、人間にとってもAIにとっても使いやすいデータ基盤を形作ります。

COMETAについての詳細をより詳しく知る

本記事で紹介しているCOMETAの製品資料はこちらのフォームよりダウンロード可能です。

髙畠正和

TROCCO®ブログの記事ライター