Googleの次世代AI「Gemini」はGPT-4と比較して高性能！いつから利用可能か解説

2023年12月7日

Googleが現地時間2023年12月6日に次世代AIモデルであるGeminiを発表しました。

OpenAIの最大ライバル企業であるGoogleがついに本気を出してきています。

OpenAIのGPT-4とベンチマーク指標を比較して、Geminiの高性能ぶりをアピールしています。

そこで、Geminiがどういったものかそのスペックと提供されるモデルの種類と利用開始時期を解説します。

目次

1. Googleが次世代AI「Gemini」を発表
2. Geminiはマルチモーダルであらゆるメディアに対応
3. 提供するGeminiのモデルは3種類
4. GeminiはOpenAIのGPT-4を強く意識
5. Gemini VS GPT-4のベンチマーク指標(テキスト)
6. Gemini VS GPT-4のベンチマーク指標(マルチモーダル)
7. Geminiはいつから利用可能？
8. まとめ・終わりに

Googleが次世代AI「Gemini」を発表

2023年12月6日、Googleが次世代AIモデルのGeminiについて発表するブログを公開しました。

ブログ記事を執筆したのはサンダー・ピチャイCEOで、その力の入りぶりが伺えます。

記事の中でGeminiはこれまでの研究を重ねた結果、最大サイズで最高のAIモデルとサンダー氏は述べています。

Geminiはマルチモーダルであらゆるメディアに対応

次世代AIモデルのGeminiの特徴はマルチモーダルによってあらゆるメディアに対応しています。

テキストだけでなく、画像や動画、音声などにも対応したモデルです。

Geminiの紹介ページでは、様々なインプットとアウトプットが実現していることを紹介しています。

画像や動画、コードに対応しているだけでなく、それらを組み合わせた複合のインプットがGeminiに対して可能です。

動画を見せながら質問すると、それに合わせてテキストを画像やコードと一緒に返してくれる。

まるで人間とのやり取りに近いことがGeminiでは実現できるようです。

提供するGeminiのモデルは3種類

Geminiは3種類のモデルが提供されます。

Gemini Ultra
Gemini Pro
Gemini Nano

それぞれ用途に応じた異なるサイズに最適化されています。

1つ目のウルトラは最大で最も有能なモデルで、複雑なタスクに対応可能です。

2つ目のプロはバランスがよい最良のモデルで、幅広いタスクに対処できます。

3つ目のナノはスマホなどのモバイルデバイス向けで、効率的なモデルです。

こうした3つのサイズのモデルを提供することで、Geminiはあらゆる要件・利用環境に対応しています。

GeminiはOpenAIのGPT-4を強く意識

GeminiはGoogleのライバルであるOpenAIを強く意識していると見られます。

紹介ページの性能に関する説明にもOpenAIのGPT-4が比較対象として登場し、各種ベンチマーク指標もすべてGPT-4との比較になっています。

LLMとしてGPT-4が最も有名ではありますが、OpenAIへの対抗心が伝わってきました。

Gemini VS GPT-4のベンチマーク指標(テキスト)

Geminiの性能はどれぐらいなのか、公開されているベンチマーク指標を紹介します。

なおGoogleが公開しているベンチマーク指標を取得したのは、最もサイズが大きく、最も高性能なGemini Ultraです。

まずはテキスト生成におけるベンチマーク指標は、一般的なものから、推論、数学、コードでGPT-4を上回っています。

唯一、常識的な推論能力についての指標であるこちらのみGPT-4がよいスコアでした。

しかし、それ以外のベンチマーク指標はGeminiが上回ったということで、GPT-4にテキスト生成では勝利したといえます。

Gemini VS GPT-4のベンチマーク指標(マルチモーダル)

つづいてマルチモーダルでのベンチマーク指標を紹介します。

マルチモーダルでは画像、動画、音声の3つのベンチマーク指標をGPT-4Vと比較しています。

その結果によると、GPT-4Vに対して、すべてのベンチマーク指標でGeminiが上回っています。

画像については大きな数値差はないものの、動画や音声はスコア差が大きくなっているため、マルチモーダルの性能が期待できます。

Geminiはいつから利用可能？

では、Googleの次世代AIであるGeminiはいつから利用できるようになるでしょうか？

Geminiの紹介ページに利用開始時期が記載されています。

そちらによると、2023年12月13日からGoogleのAI StudioまたはVertex AIにて利用可能とのことです。

Geminiの最大サイズのモデルであるUltraについては、2024年の早期に提供開始予定になっています。

ただ、提供開始前にベータ版として一部の企業や開発者に提供されるとのことです。

まとめ・終わりに

今回、Googleが2023年12月6日に発表した次世代AIモデルGeminiについて紹介しました。

Googleのサンダー・ピチャイCEOが最高のAIモデルと評するなど、自信が伺えます。

実際にベンチマーク指標でもライバルであるOpenAIのGPT-4と比較してほぼすべてが上回っています。

現時点ではまだGeminiは利用できませんが、12月13日にAI StudioやVertex AIにて利用可能とアナウンスされています。

今後Googleの生成AIであるBardやGoogle Pixelなどにも導入が進むため、利用が楽しみです。

生成AIGemini,Google,GPT-4,マルチモーダル

Posted by yamamoto

グーグル最新AI・Gemini ProのBardでの使い方！日本から日本語利用する方法

MagicAnimateでデモサイトがエラー時にColabで静止画から動画生成する方法を解説

ディスカッション

コメント一覧

まだ、コメントがありません

コメントをどうぞコメントをキャンセル

この記事のトラックバックURL