Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#18)/Google Geminiで、動画や音声の分析が可能になったよ！

生成AIの競争が熾烈ですね！

2024年5月は、生成AIの様々な発表がありましたね。

5/20には、マイクロソフトが、「Coploto+PC」（コパイロットプラスピーシー）という、AIのために設計されたWindows PCの発表がありました。

それに先駆けて、Googleは、5/14に「Google I/O」という開発か会議で、は人工知能（AI）関連の発表を様々行いました。

このように、これからも人工知能(AI)、生成AIに関する、ニュースが続くのでしょう。

Google Gemini 1.5が使えるようになり、動画や音声の分析が可能に

さて、そのような中、Google AI Studioでも、Gemini 1.5がプレビュー版として使えるように、なっています。詳細情報は、Google for Developwesの、「Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場」を参照してください。

そこで、本当に、Geminiで動画の分析が可能なのか、サンプル動画で試してみたいと思います。

まずは、Google AI Studioにアクセスしてみましょう。すると、右側のModelのメニューの中に、Gemini 1.5 Flash LatestとGemini 1.5 Pro Latestが追加されているはずです。

ちなみに、Flashとついている、Geminiのモデルは、「Our lightweight model, optimized for speed and efficiency」と説明されているように、軽く、高速に安価に分析できるモデルのようです。詳細は、「Gemini Flash」のページにそれぞれのモデルの比較が掲載されているので、確認してみてください。

ここでは、Gemini 1.5 Pro Latestを選び、先に進むことにしましょう。

プロンプトの入力の横の「＋」マークを押すと、「Sample Video」があるので、選んでみましょう。