え、知らないうちに、すごい発表がサラッと出ている
Googleの生成AI Geminiのことを調べていたら、なんかすごい機能が発表されていました。それは、「Gemini のアシスタント機能を使用してクエリを作成する」という文章です。
何がすごいかというと、Google Geminiを使って、なんとBigQueryというGoogle Cloudのデータ分析環境で、SQLというデータベース用のプログラムを、AIが生成してくれるというのです。
この機能、データベース専門家にしか関係ないと思っているかもしれませんが、Webのアクセス分析者もすごい話なのです。それは、Google アナリティクス(GA4)では、データを観察、分析する方法がいくつかあります。
Google アナリティクスのダッシュボードを活用する
Google Looker Studioで分析レポートを作成し、活用する
BigQueryにデータをリンクして、より複雑な分析を行う
と、大きく3種類の分析方法があります。
このうち、「BigQueryにデータをリンクして、より複雑な分析を行う」手法は、今までシステムに詳しい、エンジニア、プログラマーしか出来ないと思っていたのですが、「Gemini のアシスタント機能を使用してクエリを作成する」により、そのハードルが、大きく下がったのです。
実際に行えるか試してみましょう
まずは、Google Cloudにアクセス
まずは、BigQueryサービスは、Google Cloudというサービスに含まれていますので、Google検索で、「Google Cloud」と検索してみましょう。
次に、Google Cloudの画面が開きます。出てくる画面は、少しユーザーごとに異なりますが、開いた画面に、「コンソールに移動」という画面が出てくるので、それを押して、進みます。
コンソールの画面は、一見、複雑ですが、操作するメニューはそれほど、多くないので安心してください。
Google Cloudにプロジェクトを作成
Google Cloudには、プロジェクトというワークスペースが用意されています。このプロジェクトでは、以下の機能が用意されていますが、最初は、あまり気にしなくても大丈夫です。
リソースの整理
プロジェクトごとにリソースをグループ化することで、管理をシンプルにし、アクセス制御を容易にします。
アクセス制御
プロジェクトに誰がアクセスできるかを設定することで、セキュリティを強化します。
コスト管理
プロジェクトごとにコストを追跡することで、コスト削減を図り、予算管理を効率化します。
サービスの利用
プロジェクトにサービスを追加することで、様々なクラウド機能を利用できます。
APIアクセス
プロジェクトを通じて、Google Cloud PlatformのAPIにアクセスできます。
ここでも、BigQueryでAIを試すために、新しいプロジェクトを作成します。作成のためには、上部のプロジェクト名をクリックすることで、行えます。
このプロジェクト名をクリックすると、次のように「プロジェクトの管理画面」を開きます。
この画面で、「新しいプロジェクト」を選びます。
プロジェクトの名前は、任意ですが、わかりやすい名前にしましょう。名前を入力したら、「作成」を押します。
すると、先ほどの「リソースを選択」の画面に戻るので、ここで、今作ったこの場合では、「AI-BigQuery」を選びます。
BigQueryの画面を開ける
Google Cloudでは、さまざまなアプリ(機能)が利用できますが、ここでは、BigQueryというデータ分析環境を使いたいので、そのアプリを呼び出します。Google Cloudの上に、検索Windowがあるので、そこに「BigQuey」と入力します。
すると、検索結果画面が表示され、BigQueryが出てくるので、それをクリックします。
すると、次のようなBigQueryの画面が開きます。左上のメニューに、「BigQuery」と表示されましたね。
では、いよいよ、このBigQueryの、[AI-BigQuery]プロジェクトの、Testという空間に、実際のデータを取り込みたいと思います。私の方で、Rの研修で使う公開されているデータを用意したので、それを使うことにしましょう。
BigQueryにサンプルデータの読み込み
このMSLのサイトの「データサイエンス 講座の参考情報」のページにアクセスしましょう。このページの下の方に、サンプルのデータへのリンクがあります。
このdiamonds.csvをクリックすると、次の画面のようにデータ確認画面が開きます。
このデータ確認画面の左上に「↗️」ボタンがあるので、それをクリックします。
すると、画面が変わり、今度は、「ダウンロード」メニューが表示されるので、これを押して、パソコンにダウンロードしてください。これで、サンプルデータの準備は完了です。
次に、これをBigQueryの環境で使えるようにします。
BigQueryの画面に戻り、「Test」というワークスペースのメニューの「3点」マークをクリックして、「テーブルを作成」を選びます。BigQueryの中では、データベースをテーブルと呼びます。
「テーブルを作成」をクッリクすると、次のようにテーブルの設定画面が開きます。
最初に「テーブルの作成元」で、「アップロード」を選びます。
すると、ファイルを選択の欄で、パソコンからのファイルの選択が可能になるので、ダウンローしておいたファイル[diamonds.csv]を選びます。さらに、テーブル名もせってしないといけないので、[diamonds]と入力します。
さらに、下部の方にスクロールすると、スキーマというセクションが出てきます。スキーマとは、データテーブルの構造を定義する部分ですが、GoogleのBigQueryには、データを読み込むとにそのデータから、自動で設定してくれる機能があるので、これを使いましょう。
「自動検出」にチェックを入れて、先に進みます。
これで、テーブルの設定は完了です。この画面の一番下の、「テーブルを作成」を押してみましょう。BigQueryが、データを読み込み、BigQueryで使えるテーブルに変換してくれます。
データの取り込みが終わると、上の画面のように、Testの下に、[diamonds]というテーブルが作成されています。この[diamonds]をクリックしてみましょう。
[diamonds]テーブルの構造が確認できます。
BigQueryでGoogle Geminiが使えるようにする
さぁ、BigQueryでGoogleの生成AI, Google Geminiが使えるまで、もう少しです。今のところ、標準環境では、Google Geminiは使えないので、その設定を行います。
BigQueryのメニューの上部の「ペンマーク」を押してみましょう。
これを押すと、以下のように、Google Geminiとの連携画面が表示されます。
Gemini in Bigqueryを使いたいので、「続行」を押します。すると、次の画面が開きます。
この画面で、Testerに参加するにチェックして、「次へ」を押します。
この画面に出てくる、「必要なAPI」は両方とも、有効にしないといけません。「有効にする」を押すとさらに、次の画面にが開きます。
ここで、Gemini for Google Cloudを有効にするを押して先に進みます。
次の画面では、「認証情報を作成」というボタンが、画面の右上にあるので、クリックします。
認証情報の種類の設定画面が出てくるので、「アプリケーションデータ」を押して、「完了」ボタンを押します。
次の「サービスアカウントの詳細」では、デフォルト(何も変更せずに)、「完了」ボタンを押します。
すると、「Geminiを有効にする」の画面に戻ります。
必要なAPIを「有効にする」が押せるようになり、両方とも「有効」になっているのを確認して、「次へ」を押します。
シンプルな画面に戻ります。
この画面で、「次へ」を押します。
すると、BigQueryの画面に戻り、クエリのWindowの中に、
generate SQL with Gemini.という表示が出ているはずです。これで、Gemini in BigQueryがつyかえるようになりました。
Geminiを使って、BigQueryを操作
さぁ、ここからは、パラダイスです。上記のgenerate SQL with Gemini.をクリックしましょう。ポップアップウィンドウが出てくるので、そこに行いたいことを日本語で書くだけです。
ここでは、
テーブルdiamondsをcutのグループで、集計して、cutの個数が多い方から、個数を集計してください。
と、入力して、「生成」ボタンを押してみましょう。
すると、次の画面のように、SQL文が生成されます。
そこで、すかさず「挿入」というボタンを押してみます。
すると、BigQueryのクエリ(命令)として、使えるようになったので、「実行」ボタンを押して、試してみましょう。
きちんと、[diamonds]のテーブルを、[cut]という項目で個数を集計して、さらにその個数の多い順に表示してくれていますね。
このGemini in BigQueyで作った命令は、保存することもできます。
保存メニューの中の「クエリを保存」を押してみてください。
次のように、「クエリの名前」を設定する画面が出るので、名前をつけて保存しましょう。
いや、すごい時代です。生成AIを使うと、ここまで素人でもSQLが使える時代なのですね。
これから、もっと色々試していきますよ!
Comentarios