top of page

GoogleのBigQueryでは、AIを活用することで、SQLをほとんど知らなくてもデータ分析可能!

え、知らないうちに、すごい発表がサラッと出ている

Googleの生成AI Geminiのことを調べていたら、なんかすごい機能が発表されていました。それは、「Gemini のアシスタント機能を使用してクエリを作成する」という文章です。

Gemini のアシスタント機能を使用してクエリを作成する
Gemini のアシスタント機能を使用してクエリを作成する


何がすごいかというと、Google Geminiを使って、なんとBigQueryというGoogle Cloudのデータ分析環境で、SQLというデータベース用のプログラムを、AIが生成してくれるというのです。


この機能、データベース専門家にしか関係ないと思っているかもしれませんが、Webのアクセス分析者もすごい話なのです。それは、Google アナリティクス(GA4)では、データを観察、分析する方法がいくつかあります。

と、大きく3種類の分析方法があります。

Google アナリティクス(GA4)と BigQuery によるマーケティングとオーディエンスの分析情報
Google アナリティクス(GA4)と BigQuery によるマーケティングとオーディエンスの分析情報

このうち、「BigQueryにデータをリンクして、より複雑な分析を行う」手法は、今までシステムに詳しい、エンジニア、プログラマーしか出来ないと思っていたのですが、「Gemini のアシスタント機能を使用してクエリを作成する」により、そのハードルが、大きく下がったのです。


実際に行えるか試してみましょう

まずは、Google Cloudにアクセス

まずは、BigQueryサービスは、Google Cloudというサービスに含まれていますので、Google検索で、「Google Cloud」と検索してみましょう。

Google Cloudと検索
Google Cloudと検索

次に、Google Cloudの画面が開きます。出てくる画面は、少しユーザーごとに異なりますが、開いた画面に、「コンソールに移動」という画面が出てくるので、それを押して、進みます。

Google Cloudのコンソールに移動
Google Cloudのコンソールに移動

コンソールの画面は、一見、複雑ですが、操作するメニューはそれほど、多くないので安心してください。


Google Cloudにプロジェクトを作成

Google Cloudには、プロジェクトというワークスペースが用意されています。このプロジェクトでは、以下の機能が用意されていますが、最初は、あまり気にしなくても大丈夫です。

  • リソースの整理

    • プロジェクトごとにリソースをグループ化することで、管理をシンプルにし、アクセス制御を容易にします。

  • アクセス制御

    • プロジェクトに誰がアクセスできるかを設定することで、セキュリティを強化します。

  • コスト管理

    • プロジェクトごとにコストを追跡することで、コスト削減を図り、予算管理を効率化します。

  • サービスの利用

    • プロジェクトにサービスを追加することで、様々なクラウド機能を利用できます。

  • APIアクセス

    • プロジェクトを通じて、Google Cloud PlatformのAPIにアクセスできます。


ここでも、BigQueryでAIを試すために、新しいプロジェクトを作成します。作成のためには、上部のプロジェクト名をクリックすることで、行えます。

プロジェクトの切り替え
プロジェクトの切り替え

このプロジェクト名をクリックすると、次のように「プロジェクトの管理画面」を開きます。

プロジェクトの管理画面
プロジェクトの管理画面

この画面で、「新しいプロジェクト」を選びます。

「新しいプロジェクト」の設定
「新しいプロジェクト」の設定

プロジェクトの名前は、任意ですが、わかりやすい名前にしましょう。名前を入力したら、「作成」を押します。

すると、先ほどの「リソースを選択」の画面に戻るので、ここで、今作ったこの場合では、「AI-BigQuery」を選びます。

リソースを選択
リソースを選択

BigQueryの画面を開ける

Google Cloudでは、さまざまなアプリ(機能)が利用できますが、ここでは、BigQueryというデータ分析環境を使いたいので、そのアプリを呼び出します。Google Cloudの上に、検索Windowがあるので、そこに「BigQuey」と入力します。

Google Cloudで、BigQueryを検索
Google Cloudで、BigQueryを検索

すると、検索結果画面が表示され、BigQueryが出てくるので、それをクリックします。

BigQueryを選択
BigQueryを選択

すると、次のようなBigQueryの画面が開きます。左上のメニューに、「BigQuery」と表示されましたね。

BigQueryのホーム画面
BigQueryのホーム画面

では、いよいよ、このBigQueryの、[AI-BigQuery]プロジェクトの、Testという空間に、実際のデータを取り込みたいと思います。私の方で、Rの研修で使う公開されているデータを用意したので、それを使うことにしましょう。


BigQueryにサンプルデータの読み込み

このMSLのサイトの「データサイエンス 講座の参考情報」のページにアクセスしましょう。このページの下の方に、サンプルのデータへのリンクがあります。

MSLのサイト内のdiamonds.csv
MSLのサイト内のdiamonds.csv

このdiamonds.csvをクリックすると、次の画面のようにデータ確認画面が開きます。

データ確認画面
データ確認画面

このデータ確認画面の左上に「↗️」ボタンがあるので、それをクリックします。

diamonds.csvのダウンロード
diamonds.csvのダウンロード

すると、画面が変わり、今度は、「ダウンロード」メニューが表示されるので、これを押して、パソコンにダウンロードしてください。これで、サンプルデータの準備は完了です。


次に、これをBigQueryの環境で使えるようにします。

BigQueryにデータを読み込む
BigQueryにデータを読み込む

BigQueryの画面に戻り、「Test」というワークスペースのメニューの「3点」マークをクリックして、「テーブルを作成」を選びます。BigQueryの中では、データベースをテーブルと呼びます。

「テーブルを作成」をクッリクすると、次のようにテーブルの設定画面が開きます。

テーブルの設定画面
テーブルの設定画面

最初に「テーブルの作成元」で、「アップロード」を選びます。

アップロードファイルの選択と、テーブル名の指定
アップロードファイルの選択と、テーブル名の指定

すると、ファイルを選択の欄で、パソコンからのファイルの選択が可能になるので、ダウンローしておいたファイル[diamonds.csv]を選びます。さらに、テーブル名もせってしないといけないので、[diamonds]と入力します。

さらに、下部の方にスクロールすると、スキーマというセクションが出てきます。スキーマとは、データテーブルの構造を定義する部分ですが、GoogleのBigQueryには、データを読み込むとにそのデータから、自動で設定してくれる機能があるので、これを使いましょう。

スキーマを自動検出
スキーマを自動検出

「自動検出」にチェックを入れて、先に進みます。

テーブルを作成
テーブルを作成

これで、テーブルの設定は完了です。この画面の一番下の、「テーブルを作成」を押してみましょう。BigQueryが、データを読み込み、BigQueryで使えるテーブルに変換してくれます。

テーブル[diamonds]が完成
テーブル[diamonds]が完成

データの取り込みが終わると、上の画面のように、Testの下に、[diamonds]というテーブルが作成されています。この[diamonds]をクリックしてみましょう。

[diamonds]テーブルのスキーマの確認
[diamonds]テーブルのスキーマの確認

[diamonds]テーブルの構造が確認できます。


BigQueryでGoogle Geminiが使えるようにする

さぁ、BigQueryでGoogleの生成AI, Google Geminiが使えるまで、もう少しです。今のところ、標準環境では、Google Geminiは使えないので、その設定を行います。


BigQueryのメニューの上部の「ペンマーク」を押してみましょう。

BigQueryのGoogle Gemini設定
BigQueryのGoogle Gemini設定

これを押すと、以下のように、Google Geminiとの連携画面が表示されます。

Gemini in BIgqueryの設定
Gemini in BIgqueryの設定

Gemini in Bigqueryを使いたいので、「続行」を押します。すると、次の画面が開きます。

Geminiのテストへの参加
Geminiのテストへの参加

この画面で、Testerに参加するにチェックして、「次へ」を押します。

Geminiに必要なAPIを有効にする
Geminiに必要なAPIを有効にする

この画面に出てくる、「必要なAPI」は両方とも、有効にしないといけません。「有効にする」を押すとさらに、次の画面にが開きます。

Gemini for Google Cloudを有効にする
Gemini for Google Cloudを有効にする

ここで、Gemini for Google Cloudを有効にするを押して先に進みます。

Gemini for Google Cloud
Gemini for Google Cloud

次の画面では、「認証情報を作成」というボタンが、画面の右上にあるので、クリックします。

認証情報の種類の設定
認証情報の種類の設定

認証情報の種類の設定画面が出てくるので、「アプリケーションデータ」を押して、「完了」ボタンを押します。

サービスアカウントの詳細
サービスアカウントの詳細

次の「サービスアカウントの詳細」では、デフォルト(何も変更せずに)、「完了」ボタンを押します。

すると、「Geminiを有効にする」の画面に戻ります。

Geminiを有効にする
Geminiを有効にする

必要なAPIを「有効にする」が押せるようになり、両方とも「有効」になっているのを確認して、「次へ」を押します。

シンプルな画面に戻ります。

Gemini in Google Cloudの設定
Gemini in Google Cloudの設定

この画面で、「次へ」を押します。

すると、BigQueryの画面に戻り、クエリのWindowの中に、

Gemini in BiqGuery設定完了
Gemini in BiqGuery設定完了

generate SQL with Gemini.という表示が出ているはずです。これで、Gemini in BigQueryがつyかえるようになりました。


Geminiを使って、BigQueryを操作

さぁ、ここからは、パラダイスです。上記のgenerate SQL with Gemini.をクリックしましょう。ポップアップウィンドウが出てくるので、そこに行いたいことを日本語で書くだけです。

Gemini in BigQuery sample
Gemini in BigQuery sample

ここでは、

テーブルdiamondsをcutのグループで、集計して、cutの個数が多い方から、個数を集計してください。

と、入力して、「生成」ボタンを押してみましょう。

すると、次の画面のように、SQL文が生成されます。

Gemini in BigQuery output
Gemini in BigQuery output

そこで、すかさず「挿入」というボタンを押してみます。

Gemini in BigQuery使用例
Gemini in BigQuery使用例

すると、BigQueryのクエリ(命令)として、使えるようになったので、「実行」ボタンを押して、試してみましょう。

Gemini in BigQuery出力例
Gemini in BigQuery出力例

きちんと、[diamonds]のテーブルを、[cut]という項目で個数を集計して、さらにその個数の多い順に表示してくれていますね。

このGemini in BigQueyで作った命令は、保存することもできます。

クエリの保存方法
クエリの保存方法

保存メニューの中の「クエリを保存」を押してみてください。

次のように、「クエリの名前」を設定する画面が出るので、名前をつけて保存しましょう。

クエリに名前をつけて保存
クエリに名前をつけて保存

いや、すごい時代です。生成AIを使うと、ここまで素人でもSQLが使える時代なのですね。

これから、もっと色々試していきますよ!

閲覧数:186回0件のコメント

Comments


bottom of page