新しいAI「GPT-4o mini」登場!API価格がGPT-4oの97%割引と格安

OpenAIは本日2024年7月18日(アメリカ時間)に、新しい生成AIのモデルである「GPT-4o mini」を発表しました。

GPT-4oの性能を少し縮小させて、その分コスト効率を高めたコストパフォーマンスに優れたAIモデルです。

GPT-4oと比べ、GPT-4o miniのAPIは従量料金は97%OFFと格安です。

そこで、本日発表されたGPT-4o miniについて解説します。

GPT-4o miniを2024年7月18日発表

OpenAIはアメリカ時間の2024年7月18日に新しいAIモデルである「GPT-4o mini」を発表しました。

OpenAI公式ページのResearchの項目に新たにGPT-4o miniの発表ページが追加されていて、発表内容を確認できます。

OpenAIはアメリカ時間の2024年7月18日にGPT-4oのコストパフォーマンスに特化した廉価場のAIモデルである「GPT-4o mini」を発表

GPT-4oという名前の通り、GPT-4oから発展させたモデルとなっています。

名前にminiとついているように性能は少し縮小されているものの、その分コスト効率を高めています。

GPT-4o miniは従来のGPT-4oのコストパフォーマンスに優れた廉価版と言えるAIモデルです。

ベンチマークは同レベルの他の生成AIを上回る

GPT-4o miniはGPT-4oのコスト効率を高めた廉価版とお伝えしましたが、その性能を侮ってはいけません。

OpenAIの発表によると、従来の生成AIのブレイクスルーとなったChatGPTよりも長文のコンテキストに対して応答性能が上回っています。

OpenAIの発表によると、GPT-4o miniは同じ性能レベルのGoogleのGemini1.5 FlashやAnthropicのClaude3 Haikuよりも優れたベンチマーク評価を獲得

さらにGoogleのGemini 1.5 flashやAnthropicのClaude3 Haikuなど他社の廉価版AIモデルとベンチマーク評価を比較したグラフによると、一般的な応答精度を示す推論タスクでも、Gemini flashやClaude Haikuに優っています。

数学やコーディング能力に対しても、Gemini flashやClaude Haikuのスコアを上回っています。

また画像などのマルチモーダルにおいてもGPT-4o以外の生成AIより高い数値です。

OpenAIによる発表なので鵜呑みにはできませんが、発表されたベンチマーク数値から判断すると、Gemini 1.5 FlashやClaude3 Haikuよりも高性能と言えます。

すでにChatGPTがGPT-4o miniに置き換え

ChatGPTのアプリやウェブ版では、すでに従来の標準モデルであったChatGPT、GPT-3.5 TurboがGPT-4o miniに置き換えられています。

実際にChatGPTのWeb版でGPT-4o miniが使えるか試してみました。

ChatGPTのアプリ・ウェブでは無料ユーザーでも、デフォルトのAIモデルがChatGPT(GPT-3.5-Turbo)からGPT-4o miniに変更

無料版ChatGPTで適当なプロンプトを入力したあと、応答結果に表示される「モデルの変更」をマウスホバーすると、GPT-4oとGPT-4o miniが選択できるようになっています。

無料版の場合、最初はGPT-4oが一定回数まで実行できるので、GPT-4oになっていますが、上限を超えるとGPT-4o miniにAIモデルが切り替わります。

無料版ChatGPTではすでにChatGPTは選ぶことができなくなっており、GPT-4oとGPT-4o miniのみです。

今後のOpenAIのAIモデルは当面、GPT-4oとGPT-4o miniに集約されると推測されます。

GPT-4o miniのAPI料金はGPT-4oの97%OFF

GPT-4o miniは発表と同時にAPIでもモデルが公開されており、APIリクエストが可能です。

GPT-4o miniの最大の特徴はなんといってもコストパフォーマンスです。

GPT-4oの廉価版として、GPT-4o miniのAPI利用料は格安となっています。

OpenAIのAPIリファレンスにGPT-4oとGPT-4o miniのAPI利用料金について説明があります。

OpenAIのAPIリファレンスページに掲載されたGPT-4oとGPT-4o miniの比較表でそれぞれのAPI利用料金について記載

GPT-4oは入力テキスト100万トークンあたり5ドルに対し、GPT-4o miniは0.15ドルです。

出力テキストについてもGPT-4oは100万トークンあたり15ドルに対し、GPT-4o miniは0.6ドルです

GPT-4oをAPI利用した場合に比べ、GPT-4o miniのAPIで入力プロンプトにかかる従量料金は97%OFFとなっています。

日本円で換算すると、100万トークン利用しても24円しかかからない計算です。

通常の生成AIへの入力プロンプトは1000トークン未満なことが多いので、1回あたり、0.0002円と激安の利用料となっています。

ChatGPTよりもGPT-4o miniは安く半額以下

GPT-4oだけでなく、ChatGPTと比較してもGPT-4o miniはAPI料金が安いです。

GPT-4o miniとChatGPTのAPIにおける入力・出力費用は以下となっています。

  1. GPT-4o mini:入力が0.15ドル、出力が0.6ドル
  2. ChatGPT:入力が0.5ドル、出力が1.5ドル
ChatGPTのAPIと比較してもGPT-4o miniのAPI料金は半額以下で格安

そのため、GPT-4o miniのAPI料金はChatGPTと比較すると、入力プロンプトは70%OFF、出力プロンプトは60%OFFとなっています。

ChatGPTの半額以下の費用でGPT-4o miniのAPIが利用可能です。

低コスト・高速なGPT-4o miniの活用方法

GPT-4o miniは従来のGPT-4oの特徴である低レイテンシー、高速なレスポンスに加えて、低コストという特徴が追加されました。

低コストで高速なGPT-4o miniのAPIには様々な活用方法が考えられます。

従来のGPT-4oのAPIでは大量の文章のインプットを繰り返すと、API利用料が高額になりました。

しかし、GPT-4oの3%のコストでGPT-4o miniが利用できるので、大規模な文章でも低コストで生成AIが利用できます。

例えばメールの返信文案を考えてもらう場合、直近のやり取りだけでなく、過去の返信スレッドも含めた大量のテキストをインプット可能です。

GPT-4o miniによって大量のテキストの入出力と複数回のAPI実行が、実現できるようになりました。

入力はテキスト・画像、出力はテキストのみ対応(現時点)

なお、GPT-4o miniのAPIで利用できるフォーマットはGPT-4oと同じです。

GPT-4o miniのAPIは2024年7月18日の発表時点では、GPT-4o同様に入力はテキスト・画像、出力は画像のみ対応で、将来的に音声や動画の入出力に対応予定

入力で利用できるフォーマットはテキストと画像、出力フォーマットはテキストのみとなっています。

この点については将来的には入力・出力で音声や動画も対応する予定とOpenAIは言及しています。

すでに競合であるGoogleのGemini1.5 Flashでは音声や動画の入力フォーマットにも対応しているので、期待したいところです。

※ChatGPTアプリ・ウェブ版のGPT-4o miniは画像アップロード未対応で画像入力ができません。

まとめ・終わりに

今回、2024年7月18日にOpenAIが新しいAIモデルである「GPT-4o mini」を発表したことを紹介しました。

GPT-4o miniはGPT-4oのコスト効率を高めたモデルで、GPT-4oの97%OFFでAPIが利用可能です。

低コストにもかかわらず、同じ性能レベルであるGoogleのGemini1.5 FlashやAnthropicのClaude3 Haikuの生成AIよりもGPT-4o miniのほうがベンチマークが優れた結果とOpenAIは述べています。

OpenAIはChatGPT(GPT-3.5-Turbo)をGPT-4o miniに置き換えていく予定で、すでにChatGPTアプリもモデルがGPT-4o miniに置き換わっています。

GPT-4oの高速なレスポンスを受け継ぎつつ、低コストで使いやすくなったGPT-4o miniはすでにAPIも公開されているので、ぜひ活用しましょう。