GPT-4oのAPIに新モデル「chatgpt-4o-latest」登場!最新版が動的適用
ChatGPTのAPIでGPT-4oモデルに新しいモデル名として「chatgpt-4o-latest」が登場しました。
研究者や開発者を対象としたGPT-4oの最新バージョンが自動的に適用される動的モデルです。
実際にGoogle Apps Script(GAS)でchatgpt-4o-latestをChatGPTのAPIでリクエストしてみたり、既存のGPT-4oとのモデルとどう使い分けるのか、解説します。
8月13日にOpenAIがGPT-4oの新モデル発表
OpenAIの公式SNSは2024年8月13日に新しいモデルを発表しました。
there’s a new GPT-4o model out in ChatGPT since last week. hope you all are enjoying it and check it out if you haven’t! we think you’ll like it 😃
— ChatGPT (@ChatGPTapp) August 12, 2024
特にポストには具体的な説明はなく、新しいモデルが登場したことのみ紹介しています。
ただ、「気に入ってもらえる」との表現がある通り、OpenAIの自信を感じます。
約5日ほど経過した投稿ですが、すでに1300万インプレッションを記録し、多くのユーザーから注目が集まっています。
すでにChatGPTのアプリでは、この最新版が利用されているユーザーもいるとのことです。
APIドキュメントにもchatgpt-4o-latest登場
OpenAIのAPIドキュメントで、ChatGPTのAPIのGPT-4oのモデルに新しくchatgpt-4o-latestが登場しました。
GPT-4oのモデル一覧表の最後にchatgpt-4o-latestが追加されています。
確かに以前GPT-4oの新しいモデルについて動画で紹介しましたが、その時はchatgpt-4o-latestはありませんでした。
この新しいモデルは開発者や研究者が研究・評価するために利用するモデルとのことです。
動的に最新版GPT-4oがAPIで実行
新しいchatgpt-4o-latestはOpenAIがまさに研究開発を進めているGPT-4oのモデルを利用できます。
OpenAIがGPT-4oの新しいモデルを開発したら、ChatGPTのAPIでchatgpt-4o-latestを指定することで、試すことができます。
そのため、研究者や開発者が最も新しいモデルを試したい場合に、chatgpt-4o-latestを使います。
GASでchatgpt-4o-latestを試してみた
実際にchatgpt-4o-latestがどんな感じか、Google Apps Scriptで試してみました。
こちらがGoogle Apps Scriptのサンプルコードです。
function requestGpt4oCompletion() {
//スクリプトプロパティに設定したOpenAIのAPIキーを取得
const apiKey = PropertiesService.getScriptProperties().getProperty('APIKEY');
//OpenAIのAPIで利用するモデルを選択する(gpt-4oの最新モデルを適用)
const model = 'chatgpt-4o-latest';
//GPTのAPIのエンドポイントを設定
const apiUrl = 'https://api.openai.com/v1/chat/completions';
//GPTに投げるメッセージを定義(ユーザーロールの投稿文のみ)
const messages = [{'role': 'user', 'content': 'あなたはどんなことができますか?'}];
//OpenAIのAPIリクエストに必要なヘッダー情報を設定
const headers = {
'Authorization':'Bearer '+ apiKey,
'Content-type': 'application/json',
'X-Slack-No-Retry': 1
};
//GPTのモデルやトークン上限、プロンプトをオプションに設定
const options = {
'muteHttpExceptions' : true,
'headers': headers,
'method': 'POST',
'payload': JSON.stringify({
'model': model,
'max_tokens' : 2048,
'temperature' : 0.9,
'messages': messages})
};
//OpenAIのGPTにAPIリクエストを送り、結果を変数に格納
const response = JSON.parse(UrlFetchApp.fetch(apiUrl, options).getContentText());
//GPT-4のAPIレスポンスをログ出力
console.log(response.choices[0].message.content);
}
以前ChatGPTのAPIでGPT-4oモデルをリクエストする方法を解説しました。
その時に紹介したサンプルコードとほとんど内容は同じです。
5行目のAPIで指定するモデル名の部分を「gpt-4o」から「chatgpt-4o-latest」に修正しています。
実際にchatgpt-4o-latestを指定してAPIリクエストするGASの関数を実行してみます。
サンプルコード実行には、スクリプトプロパティにOpenAIのAPIキー設定と、GASの初回実行時の権限許可が必要です。
※動画でスクリプトプロパティの設定方法やGASの初回実行時の承認方法を解説しています。
従来のGPT-4oモデルと比較すると、かなり回答がコンパクトに見やすくなっています。
新しい技術を取り入れたことでより自然でわかりやすい回答が出やすいGPT-4oのモデルになっているかもしれません。
chatgpt-4o-latestは画像入力も対応
なおブログで「chatgpt-4o-latest」を紹介している記事では「画像入力には対応していない」と紹介されていました。
Google Apps Script(GAS)でマルチモーダルの画像入力も試したところ、chatgpt-4o-latestを指定してChatGPTのAPIをリクエストして、応答が帰ってきました。
GASのコードで指定している画像は下記の初代ポケモン3匹の画像です。
従来のGPT-4oと同様にポケモンの名前から順番もしっかり正しく回答してくれています。
そのため、chatgpt-4o-latestはテキストプロンプトだけでなく、マルチモーダルな画像入力も回答可能なAPIのモデルです。
本番環境では「gpt-4o-2024-08-06」推奨
なお、chatgpt-4o-latestはあくまで研究者・開発者のGPT-4oの研究・評価目的に使用するモデルです。
おそらく最新の研究が進められているモデルなので、安定的な応答が得られるチューニングが未完了な可能性があります。
そのため、生成AIを実業務で利用している本番運用環境ではchatgpt-4o-latestを使わない方がよいです。
その代わり、現在OpenAIがAPI利用に最適化したGPT-4oモデルであるgpt-4o-2024-08-06を使うことが推奨されます。
まとめ・終わりに
今回、2024年8月13日に新しく登場したGPT-4o動的モデル「chatgpt-4o-latest」を紹介しました。
chatgpt-4o-latestはOpenAIで研究開発が進められているGPT-4oの最新バージョンのモデルが自動的に適用されるモデルです。
いわゆる製品として品質を担保する安定版と呼ばれるものではなく、ベータ版と言われるモデルと言えます。
従来のGPT-4oのAPIをリクエストする方法と同じ手順で、モデル名を「chatgpt-4o-latest」に指定すれば、実行可能です。
ただ、OpenAIのChatGPTを研究している研究者や開発者を対象としており、APIとして最適化されていないため、本番運用しているサービスなどでの利用には適していません。
本番サービスにChatGPTを導入する場合は、すでに発表されているgpt-4o-2024-08-06が推奨されています。
OpenAIのChatGPTを調査・研究したい場合は、個人的な検証に「chatgpt-4o-latest」に活用しましょう。
ディスカッション
コメント一覧
まだ、コメントがありません