生成AIの競争が熾烈ですね!
2024年5月は、生成AIの様々な発表がありましたね。
5/20には、マイクロソフトが、「Coploto+PC」(コパイロットプラスピーシー)という、AIのために設計されたWindows PCの発表がありました。
それに先駆けて、Googleは、5/14に「Google I/O」という開発か会議で、は人工知能(AI)関連の発表を様々行いました。
このように、これからも人工知能(AI)、生成AIに関する、ニュースが続くのでしょう。
Google Gemini 1.5が使えるようになり、動画や音声の分析が可能に
さて、そのような中、Google AI Studioでも、Gemini 1.5がプレビュー版として使えるように、なっています。詳細情報は、Google for Developwesの、「Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場」を参照してください。
そこで、本当に、Geminiで動画の分析が可能なのか、サンプル動画で試してみたいと思います。
まずは、Google AI Studioにアクセスしてみましょう。すると、右側のModelのメニューの中に、Gemini 1.5 Flash LatestとGemini 1.5 Pro Latestが追加されているはずです。
ちなみに、Flashとついている、Geminiのモデルは、「Our lightweight model, optimized for speed and efficiency」と説明されているように、軽く、高速に安価に分析できるモデルのようです。詳細は、「Gemini Flash」のページにそれぞれのモデルの比較が掲載されているので、確認してみてください。
ここでは、Gemini 1.5 Pro Latestを選び、先に進むことにしましょう。
プロンプトの入力の横の「+」マークを押すと、「Sample Video」があるので、選んでみましょう。
すると、Google AI Studioに用意されている、サンプルの動画がいくつか用意されています。
まぁ、どの動画を選んでも良いのですが、最初の動画を選び、プロンプト欄に、「このVideoの要約を教えてください。」と入力してみましょう。
この動画は、表示もあるように、約44分ある映像です。しかし、このプロンプトで、Geminiに動画分析させると、私の場合では、61秒で、要約が回答されました。
動画の要約は、会社の会議の議事録作成や、授業のポイント理解に使われそう
このGeminiの動画分析がどの程度正確かは、様々な実証で理解されることになるでしょう。が、この機能を使うと、会社の会議の議事録作成や、教育現場の授業のポイント整理などに使われそうです。まさに、タイム・パーフォーマンス向上の機能です。
この前までは、「ハリー・ポッターとアズカバンの囚人」に於いて登場人物のハーマイオニー・グレンジャーが時間を逆転させる時計「タイムターナー」を用いて同じ時間に複数の科目を受けていたのを、羨ましく思っていたのですが、別な手法で、効率よく授業を受けられるようになりそうですね。
まぁ、そんなことして良いのかは、これから、私たちのコンセンスを得るプロセスが必要ですが。
Comments