Googleの次世代AI「Gemini」はGPT-4と比較して高性能!いつから利用可能か解説

Googleが現地時間2023年12月6日に次世代AIモデルであるGeminiを発表しました。

OpenAIの最大ライバル企業であるGoogleがついに本気を出してきています。

OpenAIのGPT-4とベンチマーク指標を比較して、Geminiの高性能ぶりをアピールしています。

そこで、Geminiがどういったものかそのスペックと提供されるモデルの種類と利用開始時期を解説します。

Googleが次世代AI「Gemini」を発表

2023年12月6日、Googleが次世代AIモデルのGeminiについて発表するブログを公開しました。

Googleのサンダー・ピチャイCEOが2023年12月6日に次世代AIモデルのGeminiについてブログで発表

ブログ記事を執筆したのはサンダー・ピチャイCEOで、その力の入りぶりが伺えます。

記事の中でGeminiはこれまでの研究を重ねた結果、最大サイズで最高のAIモデルとサンダー氏は述べています。

Geminiはマルチモーダルであらゆるメディアに対応

次世代AIモデルのGeminiの特徴はマルチモーダルによってあらゆるメディアに対応しています。

テキストだけでなく、画像や動画、音声などにも対応したモデルです。

Geminiの紹介ページでは、様々なインプットとアウトプットが実現していることを紹介しています。

Googleの次世代AIであるGeminiはマルチモーダルであらゆるメディアの入力と出力に対応さらに、テキストと画像の組み合わせも可能

画像や動画、コードに対応しているだけでなく、それらを組み合わせた複合のインプットがGeminiに対して可能です。

Googleの次世代AIであるGeminiはマルチモーダルであらゆるメディアの入力と出力に対応し、コード生成にも強い

動画を見せながら質問すると、それに合わせてテキストを画像やコードと一緒に返してくれる。

まるで人間とのやり取りに近いことがGeminiでは実現できるようです。

提供するGeminiのモデルは3種類

Geminiは3種類のモデルが提供されます。

  1. Gemini Ultra
  2. Gemini Pro
  3. Gemini Nano

それぞれ用途に応じた異なるサイズに最適化されています。

Googleの次世代AIモデルのGeminiは、ウルトラ・プロ・ナノの3種類が提供

1つ目のウルトラは最大で最も有能なモデルで、複雑なタスクに対応可能です。

2つ目のプロはバランスがよい最良のモデルで、幅広いタスクに対処できます。

3つ目のナノはスマホなどのモバイルデバイス向けで、効率的なモデルです。

こうした3つのサイズのモデルを提供することで、Geminiはあらゆる要件・利用環境に対応しています。

GeminiはOpenAIのGPT-4を強く意識

GeminiはGoogleのライバルであるOpenAIを強く意識していると見られます。

紹介ページの性能に関する説明にもOpenAIのGPT-4が比較対象として登場し、各種ベンチマーク指標もすべてGPT-4との比較になっています。

LLMとしてGPT-4が最も有名ではありますが、OpenAIへの対抗心が伝わってきました。

Gemini VS GPT-4のベンチマーク指標(テキスト)

Geminiの性能はどれぐらいなのか、公開されているベンチマーク指標を紹介します。

なおGoogleが公開しているベンチマーク指標を取得したのは、最もサイズが大きく、最も高性能なGemini Ultraです。

まずはテキスト生成におけるベンチマーク指標は、一般的なものから、推論、数学、コードでGPT-4を上回っています。

Googleの次世代AIモデルGeminiとGPT-4との各種LLMのベンチマーク指標は推論を除いてGPT-4より優れている結果に

唯一、常識的な推論能力についての指標であるこちらのみGPT-4がよいスコアでした。

しかし、それ以外のベンチマーク指標はGeminiが上回ったということで、GPT-4にテキスト生成では勝利したといえます。

Gemini VS GPT-4のベンチマーク指標(マルチモーダル)

つづいてマルチモーダルでのベンチマーク指標を紹介します。

マルチモーダルでは画像、動画、音声の3つのベンチマーク指標をGPT-4Vと比較しています。

マルチモーダルのベンチマーク指標は、画像・動画・音声いずれもGPT-4VよりもGoogleのGeminiが上回っています結果に

その結果によると、GPT-4Vに対して、すべてのベンチマーク指標でGeminiが上回っています。

画像については大きな数値差はないものの、動画や音声はスコア差が大きくなっているため、マルチモーダルの性能が期待できます。

Geminiはいつから利用可能?

では、Googleの次世代AIであるGeminiはいつから利用できるようになるでしょうか?

Geminiの紹介ページに利用開始時期が記載されています。

そちらによると、2023年12月13日からGoogleのAI StudioまたはVertex AIにて利用可能とのことです。

Googleの次世代AIモデルのGeminiは2023年12月13日よりAI StudioやVertex AIで利用可能に

Geminiの最大サイズのモデルであるUltraについては、2024年の早期に提供開始予定になっています。

ただ、提供開始前にベータ版として一部の企業や開発者に提供されるとのことです。

まとめ・終わりに

今回、Googleが2023年12月6日に発表した次世代AIモデルGeminiについて紹介しました。

Googleのサンダー・ピチャイCEOが最高のAIモデルと評するなど、自信が伺えます。

実際にベンチマーク指標でもライバルであるOpenAIのGPT-4と比較してほぼすべてが上回っています。

現時点ではまだGeminiは利用できませんが、12月13日にAI StudioやVertex AIにて利用可能とアナウンスされています。

今後Googleの生成AIであるBardやGoogle Pixelなどにも導入が進むため、利用が楽しみです。