ChatGPTへの投稿を訓練データ利用制御が可能に!学習利用をOFFにする設定手順

2023年4月26日

ChatGPTに入力したデータをAIのトレーニングデータに適用しない設定が可能になりました。

これまでChatGPTに入力したデータは、ChatGPTの訓練用データとして活用されるポリシーとなっていました。

そのため、機密データや社外秘のコードなどを入力すると、ChatGPTの訓練データとして活用され、流出する恐れがありました。

ChatGPTに投稿した情報が管理できるようなったことで、よりChatGPTの活用が見込まれます。

そこで、チャット履歴と訓練データ利用の制御に関するOpenAIが発表内容と、ChatGPTに投稿したデータを学習利用しないようにOFFにする設定方法を解説します。

従来のChatGPTは投稿がAIの学習データに利用

ChatGPTでは投稿したテキストはAIの訓練データとして活用される仕様でした。

入力情報が訓練データとしてAI学習に使われると、別のユーザーの応答結果として表示されることがあります。

以前、サムスンなどでもChatGPTに機密情報であるプログラミングコードを投稿してしまう漏洩問題が起きていました。

こうした点から、これまでは企業や団体でChatGPTを利用する場合は、社外秘や機密データを入力してはいけませんでした。

ChatGPTで訓練データ利用可否を設定可能に

しかし、ChatGPTを開発するOpenAIが、現地時間2023年4月25日に新しいデータ管理方法を発表しました。

ChatGPTを開発するOpenAI社がアメリカ時間2023年4月25日にChatGPTでの新しいデータ管理方法を発表

New ways to manage your data in ChatGPT

新しいデータ管理方法では、チャット履歴とトレーニングに使用できる会話の制御ができるようになりました。

ChatGPTに投稿した情報をAIの訓練データとして活用しないよう、ユーザー側で制御できるようになっています。

会話データは不正利用対策などの目的もあり30日間、OpenAI社のサーバーに保管されるものの、訓練データ設定をOFFにすることで流出する危険性が低減されました。

有料版ChatGPT Plusで訓練データしない設定手順

実際にChatGPTで、チャット履歴と訓練データ利用をオフにする方法を試してみました。

有料版であるChatGPT Plusの画面にアクセスすると、これまでのデフォルト設定で会話履歴が表示されています。

デフォルトのChatGPT Plusの画面では、左側にチャット履歴が表示され、投稿データはAIの訓練用に活用される設定

1.左メニューにあるアカウント名の右側にある「…」をクリックすると表示される「Setting」を選択します。

ChatGPTへの投稿データを訓練用に使用されないようにするため、ChatGPT Plusの左メニューにあるアカウント名の「…」をクリックし、「Setting」を選択

2.Setting画面が表示されるので、「Data Controls」のところにある「show」リンクをクリックします。

ChatGPTの訓練データ利用をオフにするため、Setting画面で「Data Controls」の右側にあるShowリンクをクリック

4.「Chat History & Training」のところのトグルボタンがONになっているので、クリックしてOFFにします。

デフォルトのChatGPT PlusではSettingのChat History & Trainingのトグルボタンがオンで有効に
ChatGPTで投稿したテキストデータをAIの訓練データとして利用されないようにSettingからオフに

Setting画面の✗マークを押して閉じると、左側に表示されていたチャット履歴が表示されなくなりました。

ChatGPT Plusでチャット履歴と訓練データ利用をオフにした結果画面

入力情報も30日間はOpenAIのサーバーに保存されるものの、ChatGPTのトレーニングデータとして活用されなくなります。

AIの学習データとして利用されなくなるので、機密情報を入力してしまっても、ChatGPTが別ユーザーへの回答にその情報を利用することはありません。

無料版ChatGPTユーザーも訓練利用OFFが可能

続いて念のため、無料版ChatGPTでも同じ設定ができるか確認してみました。

無料版ChatGPTでもチャット履歴と訓練データ利用をオフにでき、すべてのユーザーで設定可能

ChatGPT Plusと同じようにアカウントのSettingからチャット履歴と訓練データ利用をオフにすることができました。

ChatGPTでチャット履歴とAIの学習利用の設定を無効にした結果画面

そのため、無料版も含めたすべてのChatGPTユーザーが、入力テキストをトレーニングデータとして活用されないように設定が可能です。

大企業向けのChatGPT Businessプランを導入予定

OpenAIは訓練データ利用可否の設定機能とともに、ChatGPT Businessというエンタープライズ向けのプランを数カ月後に導入予定と発表しました。

ChatGPTの大企業向けのエンタープライズプランである「ChatGPT Business」の発表内容

OpenAIの発表内容をDeepLで翻訳したところ、以下の和訳になりました。

また、データ管理を必要とするプロフェッショナルやエンドユーザーを管理したい企業向けに、新しいChatGPT Businessサブスクリプションの開発に取り組んでいます。ChatGPT Businessは、APIのデータ使用ポリシーに従います。つまり、エンドユーザーのデータは、デフォルトではモデルのトレーニングに使用されません。ChatGPT Businessは、今後数ヶ月で利用可能になる予定です。

最後に、設定の新しいエクスポートオプションにより、ChatGPTデータをエクスポートし、ChatGPTがどのような情報を保存しているかを理解することがより簡単になりました。会話とその他すべての関連データを含むファイルをメールで受け取ることができます。

ChatGPT Businessは、入力データやユーザー管理ができるようになっており、大企業向けのサービスです。

ChatGPTのAPIと同様にデフォルトで投稿データが訓練データに活用されないようになっています。

今回、ChatGPTの訓練データ利用可否がユーザー側で設定できるようになりましたが、ユーザーによっては設定忘れで、オンのままになることがあります。

ChatGPT Businessプランを企業で導入すれば、訓練データ利用を組織単位で無効にして、情報流出を防止できます。

今後数か月後にChatGPT Businessはリリース予定とのことで、このプランによって大企業でのChatGPT利用が促進されることが推測されます。

まとめ・終わりに

今回、ChatGPTに入力したデータの履歴や訓練データ利用をユーザーが制御できるようになったことを紹介しました。

これまでのChatGPTでは、入力したテキストがAIのトレーニングデータとして活用されるため、機密データを入力すると、AIの生成結果として流出する恐れがありました。

しかし、ChatGPTのサービス画面で個々のユーザーがチャット履歴と訓練データ利用をOFFにすることが可能になりました。

訓練データ利用しないように設定しておけば、30日間はサーバーにデータが残るものの、学習したAIから流出する可能性がなくなりました。

今後数か月で詳細なデータ・ユーザー管理ができるChatGPT Businessというプランも登場します。

ChatGPTにデータの制御機能が実装されたことで、今まで利用を控えていた大企業を含め、より多くの人々にChatGPT利用が拡大する見込みです。