変化の激しい今の時代、これまでの経験則だけでビジネスにおける重要な決定を下すことは難しくなってきました。そんなときに使われるのがデータ分析です。仮説を立て、データを活用して検証することで、カンや経験だけではない根拠にもとづいて意思決定できます。
ビジネスパーソンがデータ分析力を身につけ、自らデータの収集、検証を行うことで、素早い意思決定が可能になります。こういった背景から、データ分析力で汎用的に使えるSQLを学ぶ必要性も高まっているのを感じます。
本セミナーでは、2023/3/16発売の書籍「データ分析力を高める ビジネスパーソンのためのSQL入門」の内容からさらに重要な部分に焦点を置き「30分でわかる」をテーマとし、著者である高橋様に語っていただきました。
当日のセミナーはこちらからご覧いただけます。
こんな方におすすめ
- ビジネスパーソンの中でも現状データ分析に関わりがある方々
- ビジネスパーソンとしてデータ分析に必要なSQLの知識を身につけたい方
- カンや経験だけではない根拠にもとづいた意思決定をしていきたい方
講演者紹介
高橋 光氏
デジタルマーケティングコンサルタント
2011年に新卒でヤフー株式会社に入社し、Webエンジニアとしてサービスの開発、運用、企画、提案、など幅広くサービスに貢献。またHadoopやTeradataを利用したデータ分析や Tableauを使った可視化など、データを活用してサービスを成長させる仕組みを導入するなどデータ分析に関わる業務も担当。2016年からは株式会社イーブックイニシアティブジャパンに出向し、社内でデータサイエンスグループを立ち上げグループマネジャー(部長)として社内のデータ活用を促進。マーケティング施策の効果検証、事業分析、プロダクトのABテストなどデータを活用した意思決定に貢献。チームメンバーのSQLスキルアップや社内全体でのSQL勉強会などのデータ活用スキルアップ活動なども行い、組織全体をデータドリブンにする活動を実施。2021年から外資系コンサルティング企業に入社し、SQLを使ったデータ分析などデータを活用したマーケティング支援を実施。また複業としてプロバスケットボールリーグ(Bリーグ)のクラブチームで、マーケティングストラテジストとしてデータ分析のサポートを行ったり、その他複数社でSQLを活用したデータ分析のサポート経験あり。
ブライアン(小平剣也)
株式会社primeNumber マーケティング本部
株式会社delyに参画し、創業期のマーケティング部門の立ち上げに携わる。その後、株式会社マネーフォワードでBtoCとBtoBのSaaS領域のマーケティングとPM(プロジェクトマネージャー)を担当。現在は株式会社primeNumberでマーケティング領域の責任者を務める。よく使うデータサービスは、BigQueryやLooker Studioなど。
SECTION 1:30分でわかる「データ分析力を高める ビジネスパーソンのためのSQL入門」
SECTION1では、高橋氏に新刊の紹介と活用法、魅力、SQL実行のデモなどについて説明していただきます。
今SQLを学ぶでき3つの理由 / 本書の3つの魅力
高橋氏:「今日は大きく二つのテーマでお話しします。一つ目は、なぜ今、SQLを学ぶべきなのかについてです。皆さんの中にはこれからSQLを学ぼうと思っている方が多いと思います。SQLを学ぶ理由と、どのようなものを学べるのかについて説明します。
二つ目は、私が出版したばかりのSQL入門書の魅力についてお話しします。この本のどのようなところが魅力的なのかを具体的に説明いたします。
最後に、実際にSQLを使ったデータ分析がどのようなものなのかを、具体的な画面を見ながら解説します。」
今SQLを学ぶでき3つの理由

高橋氏:「なぜ SQLを学ぶべきか?その理由は3つあります。
一つ目は、データ分析におけるコストパフォーマンスが良いという点です。SQLの学習コストは比較的低く、データ抽出作業を他のエンジニアに頼むことなく自分で行うことが可能になります。
二つ目は、SQLは幅広く利用できるので、その汎用性が高いという点です。
三つ目は、さまざまな職種で役立つスキルとして取得できること。これらがSQLを学ぶべき3つの理由です。」
①データ分析のSQLはコスパがよい

高橋氏:「第一に、データ分析において、SQLはコストパフォーマンスが良いという点です。学習すれば広範な用途に使えるというメリットがありますが、一般的なプログラミング言語に比べると学習コストが非常に低いという特徴があります。
たとえば、Pythonなどのプログラミング言語は、習得すればデータ分析からソフトウェア開発まで、非常に幅広く使えます。しかし、その一方で学習コストが高く、プログラミング経験のない人には敷居が高いのが難点です。
私自身、プログラミング経験はあるのですが、それでもPythonのようなプログラミング言語の初学習は難易度が高いと感じました。
Excelによるデータ分析も一定の役割を果たせますが、対応可能なデータ量が限定され、大量データの処理では性能に限界があります。
これに対してSQLは、これらの課題を克服する手段とてその存在感を示しているのです。
SQLはデータ分析におけるコストパフォーマンスが良いです。一度学習すれば、データ分析だけでなく、ソフトウェア開発など幅広い場面で使用できます。また、一度習得すれば、長い期間活用できる点もSQLの大きなメリットだと思います。
私自身も10年以上前に学んだSQLを今も使っていますし、これから10年後もほとんど変わらずに使い続けられると思います。
このような理由から、SQLの学習は非常にコストパフォーマンスが良い選択となるはずです。」
SQLは短時間で基本的な理解ができる

高橋氏:「SQLは、短時間で基本的な理解ができ、実際に業務でSQLを使い続けることでスキルを養うことができます。
たとえば1.5時間のオンライン講座を2回受ければ基本的なSQL構文を学べます。また、今回の約240ページのSQL入門書を一冊読み通せば基本的なSQLの知識を獲得できます。
そして実際に業務でSQLを使い続けていけば、約半年でデータアナリストとしてSQLを使いこなせるレベルにまで成長できると思います。
ただ、一度学んだからといってすぐに使いこなせるとは限らないので、日々の業務などで少しずつ使い続け、半年を目安にスキルアップを図っていくことが大切です。」
②実務で幅広く使える

高橋氏:「SQLは、大企業で一般的に見られるデータ分析環境で幅広く利用されています。
基幹システムとは異なり、さまざまなデータベースが存在します。これらの情報を一か所に集約し、データウェアハウスとして活用するのが一般的です。
データウェアハウスから必要なデータを取得するには、SQLの知識が必須となります。たとえばAmazon RedshiftやGoogle BigQuery、TREASURE DATAなどのデータウェアハウスでは、組織の中でビジネス上必要なデータを取得するためにSQLが使われています。
加えて、BIツールを使う場合でもSQLは極めて役立ちます。データウェアハウスからデータを接続し、特定の指標を作成する場合、より具体的なデータへの接続や前処理が必要になることがあります。その際にもSQLの知識があると、より柔軟に対応できます。
SQLの理解と活用は、ビジネスのスピードを向上し、より適切な意思決定を促進するための重要なスキルです。
大企業や条件が整っている会社ではすでにデータ分析環境が整備されていることが一般的ですが、そうでない場所でもSQLは活用できます。
たとえば、まだデータ分析環境が整っていない会社や、個人で行うデータ分析状況でも、基幹システムから一度CSVファイルのような形でデータを抽出し、それを自分のPCに取り込むことでSQLを使ってデータ分析が可能となります。
それは、自分のPC上でSQLを実行し、データ分析していくというもので、この本でも詳しく書かれています。
環境構築はそれほど難しくありません。自分のPC上でSQLを用いてデータ分析できます。」
③掛け算のスキルとして役立つ

高橋氏:「SQLを学ぶべき理由として、掛け算のスキルとして役立つ点が挙げられます。SQLは実務で活用しやすいスキルであり、マーケティング部門やデータアナリスト、営業などさまざまな職種で活用可能です。
たとえば、マーケティング領域ではECサイトの行動分析や、顧客の購買分析、広告やキャンペーンの効果検証などデータ分析が必須となります。こういった分析を自分自身でできれば、より高度なマーケティング戦略へ繋がります。
また、データアナリストやデータサイエンティストなど、データを扱う職種では、データウェアハウスからのデータ抽出や、BIツールからのデータ接続、データの前処理など、SQLスキルが必須となります。
営業でも売れ筋商品分析や成果件数分析、地域別分析などのデータ分析にSQLは非常に有効です。
つまり、SQLスキルはどの職種でも活用でき、その業務を高度化させる可能性を秘めているのです。」
本書の3つの魅力

高橋氏:「私の書籍の魅力と、ビジネスパーソンがSQLを学ぶ理由についてお話しします。まずは、本書の魅力から始めたいと思います。本書を通じて、素早い意思決定のためのデータ集計スキルが身につきます。
『データ分析力を高める ビジネスパーソンのためのSQL入門』の魅力は主に3つあります。
一つ目は、これまで無料で公開していたSQL勉強会の資料をもとに、さらにパワーアップした内容となっていることです。
二つ目は、SQLがまったく未経験の方でも、実践的なハンズオンを通じて使えるレベルのSQLを学べることです。
三つ目は、実際のビジネスで必要とされるデータ分析の内容に特化しているため、効率よく学べることです。
これらを順番に解説していきます。」
無料版と本書の違い

高橋氏:「本書は無料で公開したSQL勉強会資料の上位互換です。基本的には、SQLの概念や構文の説明、実行環境の構築方法、実務で役立つTipsをより体系的にまとめたものが本書の特徴です。初心者がゼロから学びたいと思っている方にお勧めです。」
本書はnoteで公開したSQL勉強会資料の上位互換

高橋氏:「無料版の資料や本書、どちらも同じように実行結果を自分の手元で確認しながら学べます。しかも本書の特徴は、実行結果も含んでいる点であり、読み物としても成立するように作られています。
そのため、非常に読みやすい内容になっています。SQLをまったく知らない人でも、ハンズオン中心の実践を通して使えるSQLを学べるという点が挙げられます。」
本書の対象者

高橋氏:「対象読者は、これからSQLを学ぼうと思っている方、または仕事でSQLを使い始めたけれどしっかりと理解できていない方、Excelを使ってデータ集計している方、そしてより効率的な環境でデータ分析をしたいビジネスパーソンです。」
本書の特徴

高橋氏:「実践を中心に、使えるSQLを学べます。データ分析で使用するSQLを一冊で学ぶことができ、エンジニアではなくビジネスパーソンを対象にしています。また、ビジネス書として読みやすい240ページにまとまっており、ハンズオン形式で実践的なSQLを学習できます。」
本書の特徴 ハンズオンで読み進める

高橋氏:「同様の入門書は他にも多くありますが、本書の異なる点は、データ分析を行うビジネスパーソンを対象にしている点と、実際のビジネスシーンで必要となるSQLスキルを短時間で効率的に学べるところです。
そのため、コンパクトに必要な点だけを学べるという特徴を持っています。また、自分のPCを使ってSQLを実行し、その結果を確認しながら読み進むことができます。
さらに、どんなSQLを実行するとどんな結果が返ってくるのかを理解することで、実務で使えるデータ分析のスキルが身につきます。
今回のセミナーでは、データ分析でよく使う左外部結合というテーマについても具体的に解説します。また、SQLの実行方法や結果の確認、理解の方法についても、具体例を通じて説明します。
これらを通じて、参加者の皆様が楽しく、理解しながらSQLを一から学べます。」
本書の構成

高橋氏:「本書では、実際のデータ分析に必要な内容に特化して取り組むことで、効率よく学びます。
本書の構成は、全体を3つの部分に大きく分けています。第一章では、「なぜSQLが必要なのか?」、「SQLとは何なのか?」といった内容を説明しています。これらは、SQLの重要性とその概念を理解し、学びを深めるための基礎となる部分です。
第二章では、ご自身のPCでSQLを実行するための環境構築について解説しています。しっかり理解できるように丁寧に説明しています。
そして、第三章以降ではSQLの詳細な使い方を学んでいく部分です。具体的な構文の理解や、データ分析でよく使われているSQLの機能に特化した内容を取り扱っています。
このように、本書では必要な内容だけを抽出して解説し、不必要な部分を省くことで効率的な学習を目指しています。」
本書で触れる内容・触れない内容

高橋氏:「本書の特徴は実務のデータ分析に必要な内容に特化しているため、効率よく学べる点です。
たとえば、エンジニアとして必要なSQLの知識には触れない一方で、ビジネスパーソンがデータ分析で必要とするSQLの知識を中心に解説しています。
また、データ分析で利用頻度の少ない完全外部結合やクロス結合、初学者にとって難易度が高いWINDOW関数については扱っていません。
基本的なSQLの知識と、読み解きができる能力を身につけることに重点を置いています。」
本書の魅力 SQLを学びたいと思った人が最初に手に取る1冊

高橋氏:「このセミナーや書籍の目標は、参加者が新たにSQLを学びたいと思ったとき、このセミナーや本が参考になった、と感じていただきたいということです。このスキルは頻繁に使うほど身につきますし、それにより学習が容易になると私たちは信じています。
また、複雑なクエリを書きたいと考えている方や、SQLにまったく知見がない、使ったことがないという方に対しても、この本を一読いただいた後に、他の書籍や資料を探してみていただけたらと思います。
このセミナーと本はSQL学習の第一歩となる資源である、というのが私たちの思いです。」
ここからは、具体的なSQLを含んだデータ分析の具体例をご紹介していただきました。
SQL実行のデモ

高橋氏:「このセミナーで取り扱うSQL実行環境についてデモンストレーションを行います。具体的には、DB Browser for SQLiteというツールを使ってSQLの実行を紹介します。また、ECサイトの購入データ分析例も示します。
この環境は、本書で紹介しているものとまったく同じです。画面共有しながら具体的な手順を説明していきますので、ぜひ参考にしてみてください。」

高橋氏:「ハンズオンでは私のPC上でSQLiteを用いてSQLを実行します。これにはSQLiteデータベースと、データ抽出アプリケーションとしてのSQLite Browserを使います。
すでにセットアップは完了していますが、アプリケーションのインストール方法やサンプルデータの取得方法は本書内に詳しく記載しています。
今回のデータ分析では架空のECサイトのデータを扱う設定ですので、それを頭に入れていただければと思います。」

高橋氏:「ここに表示しているのはSQLiteのブラウザ画面です。各行には、order_id、user_id、order_product_id、order_date、is_discounted、is_canceledといった情報の一部が含まれています。
また、特定のテーブルのデータを参照します。このテーブルには注文情報や商品情報、顧客情報などが含まれています。たとえば、顧客の性別や年齢層などの情報です。
このようにデータベース内にはさまざまな情報が格納されており、これらの情報を適切に分析することで、ビジネスの意思決定をサポートします。」

高橋氏:「ここからはDB Browser for SQLiteを使用し、データベースを開きます。その後、SQLを実行し、既存のデータを分析しやすい形に整理していきます。
一般的に、実際のビジネス現場ではこのような過去データ分析が行われます。サンプルを使ってSQLの基本操作を解説していきます。」

高橋氏:「まず、SQL文を実行することで大カテゴリ別の商品数を集計できます。
この文は「productsテーブルからlarge_categoryが’食品’であるデータを取得し、large_categoryごとに集計(カウント)します。集計結果はlarge_categoryについて昇順でソートされます」という意味です。
この例では大カテゴリが’食品’のみなので、ORDER BYでのソートは結果に影響しません。また、このSQL文は柔軟にアレンジできます。たとえばカウント数が多い順に結果をソートしたければ、ORDER BY の部分を修正します。
このようにSQL文を実行し、自分の欲しいデータを取得する流れを理解することが重要です。」



本書の内容を応用したデータ分析例

高橋氏:「書籍の内容を応用したデータ分析例の話をしましょう。具体的には、オープンデータを利用したデータ分析のデモです。この書籍を読めば、SQLの理解を深めて、オープンデータの分析が可能になります。
今回は国民の祝日のデータを使用するデータ分析例を紹介します。データはURLからCSV
形式でダウンロード可能です。本書のスキルが生かせる場面として、何よりこのような分析が可能ということを理解していただければ幸いです。」

高橋氏:「オープンデータのダウンロードから始め、それを用いて実際にデータ分析したいと思います。本書を通じてSQLを理解すれば、オープンデータを用いた分析も可能です。これは、本書の内容を具体的に応用した例です。」

高橋氏:「ここに表示されているのは、”データポータル”というサイトです。こちらのサイトは、さまざまなデータを提供しています。今回は、この中から「国民の祝日」に関するデータを使用します。
データはCSVファイルとしてダウンロード可能ですので、指示通りダウンロードします。このCSVファイルを用いてデータ分析を行います。」

高橋氏:「データベースは「国民の祝日」についての情報を含んでおり、「cao_20190522_0002」という管理名で管理されています。このデータを用いて、SQLを用いたデータ分析の方法を解説します。」



高橋氏:「データ分析環境が整っていなくても、元のデータを自身のPCに取り込むことで、手元でSQLを使ってデータ分析できます。実務でSQLを使う場面は幅広く、特に小規模や個人で行うデータ分析においても有効です。
取り扱うデータを自分のPCに保存すれば、手元でSQLを使ってデータ分析できます。また、これにPythonなどのプログラミングを組み合わせることで、更なる分析の幅が広がります。」

高橋氏:「具体的な例として、CSVファイルをダウンロードし、それをSQLiteを用いてデータベースに取り込み、分析していく手順について解説します。」

高橋氏:「こちらがDB Browser for SQLiteの画面です。左側のリストで、”orders”, “products”, “users”という3つのテーブルが確認できます。これらは、先ほどダウンロードしたCSVファイルからデータをインポートした結果、作成されたテーブルです。
インポートは上部メニューから”データベースを開く”を選択し、ダウンロードしたCSVファイルを指定することで行えます。これにより、データを直観的に確認できます。」

高橋氏:「ダウンロードしたデータベースのカラム名が日本語表記となっていました。これをより扱いやすくするために、英語に変換していきます。具体的には、テーブル名やカラム名を指定して変更できます。」

高橋氏:「実際にDB Browser for SQLiteを用いてデータを開いてみましょう。ここでは、”syukujitsu_date(祝日の日付)”という項目を確認できます。」

高橋氏:「今回、私たちはDB Browser for SQLiteを利用して祝日のデータを分析します。このデータには、その日が何の祝日であるか、何年の何月の何日であるかという情報が含まれています。
はじめにこのデータをSQLを使って加工し、各年の祝日の日数を計測します。具体的には、各行から年度情報を抽出し、その年ごとに祝日をカウントします。これにより、各年の祝日の日数がわかります。
そして結果として表示された表では、古い年度から新しい年度へと祝日の日数が表示されています。特定の年度のデータを具体的に見たい場合、適切な条件を付け加えることでデータを絞り込むことができます。たとえば、2020年に何日の祝日があったのかといった情報が簡単に取得できます。
また、たとえば来年の8月11日が祝日であることが確認できます。これをもとに、来年は今年よりも4日祝日が多いと予想することも可能です。
このような情報は、ビジネスの計画を立てる際などに役立つでしょう。」
SQLを活用できる場面は多い

高橋氏:「実務で幅広く使えるSQLの利点の一つは、データを自分のパソコンに保存することで、手軽にデータ分析できることです。オープンデータを用いてデータ分析できるだけでなく、自分の手元にあるデータでも同様に分析できます。データ分析の幅を広げる技術として非常に有用です。
もう一つポイントとして、本書の内容を実生活に応用したオープンデータ分析の具体例を紹介します。”国民の祝日”というテーマで、祝日のデータを1955年から2024年までの期間で分析します。分析に利用するデータは、URLからダウンロード可能なCSVファイルを利用します。
このようなスキルがあれば、思っている以上に活用できる場面は多いはずです。たとえば、オープンデータを利用した地域分析など自分が興味を持ったテーマを自分の手で分析できます。」
まとめ

高橋氏:「本書では、ビジネスパーソンのために、迅速な意思決定のためのデータ集計スキルが身につく基礎知識を提供します。この本を通じ、一人でも多くの方がSQLに興味を持ち、SQLを使えるスキルを得たら幸いです。実際に何か新しいことを学び始めている途中の方々の反応が楽しみです。
本日のセミナーで解説した内容について、まだ完全に理解できていない方も多いかと思いますが、この本を一読することで、理解の幅が広がることを期待しています。本日は以上とさせていただきます。ありがとうございました。」
SECTION 2:TROCCO®のご紹介
SECTION 2では、データ統合ツールのTROCCO®について、ご説明します。
データ統合ツールTROCCO®のご説明

ブライアン:「データ統合ツールTROCCO®についてご説明いたします。株式会社primeNumberが提供しています。SQLについて理解し、扱えるようになった後のステップとして、多くの方が検討しているサービスです。」
TROCCO®とは?

ブライアン:「TROCCO®は、データ統合を自動化するETL/ELTサービスであり、処理エンジンにはEmbulkを採用しています。AWS東京リージョンのEKSを基盤に運用されています。
データをビジネスに活用するまでには、複数のステップが必要です。収集から統合、蓄積、可視化、分析、活用といったステップが含まれますが、実際には統合や蓄積といったステップでデータエンジニアリングに必要な作業時間が発生します。
私たちが提供しているサービスは、データエンジニアリングの工程を自動化し、工数を削減することを目指しています。データが点在している場合にそれらを統合するという作業を支援しています。」
TROCCO®の統合イメージ

ブライアン:「TROCCO®の統合機能について説明いたします。こちらは提供しているサービスのイメージ図です。
この中にたとえば、広告データやGoogleスプレッドシート、さらにはSalesforceなどのクラウドアプリケーションからのデータを始め、自社が持っているデータベースやGoogle Cloud Storageなどのストレージサービスからのデータを取り込むことが可能です。
それらのデータを、TROCCO®を使ってデータウェアハウスに統合し、DWHやBIツールを介してデータ分析や可視化できるサービスです。」
TROCCO®のご提供領域

ブライアン:「TROCCO®は自社の領域を提供しており、そのアーキテクチャとして、クラウドDWHに対応するSnowflakeやBigQueryなどを使用しています。アーキテクチャはデータ品質やセキュリティ、データガバナンスを重視しています。
また、データウェアハウスとして、参照データやマスタデータの管理機能に加えて、ドキュメントやコンテンツの管理機能も備えています。そして、これをBIツールであるTableauやRedashなどと連携しています。
このような製品は国内でもありますが、TROCCO®の強みは、ETLの機能だけでなく、データエンジニアリングに必要な機能を幅広く提供し、データエンジニアリングにかかる工数を削減できることです。ETLやワークフロー、データマート、DB連携、データカタログなどの機能が一つに統合されています。
TROCCO®は、多種多様な業種や規模のお客様にご利用いただいています。具体的には、メルカリやリクルート、弁護士ドットコムなど200社以上の企業がTROCCO®を採用しております。それらの企業には、データサイエンティストやアナリスト、データエンジニアといった職種の方々が幅広くおり、高評価をいただいております。」
まとめ
本セミナーでは、30分でわかる「データ分析力を高める ビジネスパーソンのためのSQL入門」の魅力と活用法などを詳しく解説しました。SQLの基礎をマスターすることで、より自由で深いデータ分析が可能となります。
さらに、次のステップとして、データ分析ツール「TROCCO®」を利用することで、データを効率的に活用する方法も紹介しました。TROCCO®を使用することで、各種データをさらに活用できます。
SQLやデータ分析に関する課題を抱えている方は、本内容を参考に、データ分析の更なる効果的な活用を目指してみてください。
弊社の提供するデータ統合ツール「TROCCO®」は、データの統合や分析をサポートする多機能なツールです。クレジットカード不要のフリープランでのお試しも可能です。興味のある方は、この機会にぜひご利用ください。
