ChatGPTやGeminiといった生成AIツールは、今や多くのビジネスシーンで活用され、生産性を飛躍的に向上させる強力な武器となっています。しかし、その圧倒的な利便性の裏には、入力した情報がAIの学習データとして利用され、意図せず外部に流出しかねないという、見過ごされがちな重大なリスクが潜んでいることをご存知でしょうか。
この記事では、AIを安全に活用するために不可欠な「データ学習」のリスクと、それを防ぐための具体的な設定方法について、専門知識がない方にも分かりやすく解説します。
知らないと怖い!ほとんどのAIツールは「データ学習オン」が初期設定
驚かれるかもしれませんが、多くの主要な生成AIツールでは、特に無料アカウントの場合、アカウントを登録した直後の初期設定(デフォルト)で、入力したデータがAIの学習に利用される設定(データ学習オン)になっています。
これは、設定を意図的に変更しない限り、あなたがAIに相談した業務上の機密情報、顧客情報、社外秘のソースコード、そしてプライベートな情報まで、すべてがAIモデルの「栄養」として吸収されてしまう可能性があることを意味します。もちろん、Google Workspaceのようなビジネス利用を前提とした法人向け有料プランでは、デフォルトでデータ学習がオフに設定されているため、その心配はありません。
データ学習がオンだと、なぜ危険なのか?
入力したデータがAIに学習されると、主に2つの大きなリスクが生じます。
- AIの回答として機密情報が流出する可能性
学習されたデータは、AIが他のユーザーからの質問に回答する際に、知識の一部として利用される恐れがあります。実際に、社内特有の情報を学習したAIが、後日その情報を事実であるかのように他のユーザーに回答してしまったという事例も報告されています。 - 入力した元データそのものが流出する可能性
最新のAIモデルでは、入力されたデータをそのまま出力しないように「ガードレール」と呼ばれる安全機能が設けられています。しかし、この機能も完璧ではなく、特殊な質問(プロンプト)によって、学習データに含まれる個人情報やプログラムコードが引き出されてしまう可能性はゼロではありません。
例えば、大手通販サイトのAmazonでは、弁護士が従業員に対し、ChatGPTの回答が社内の機密データに酷似していた事例があったと警告しています。これは、従業員が入力した情報がAIに学習され、意図せず他の回答に利用された可能性を示唆しており、決して他人事ではありません。
【今すぐ確認!】データ学習をオフにするための具体的な設定方法
この危険なデフォルト設定を放置することは、ビジネスにおいて致命的な情報漏洩に繋がりかねません。
法人向けのビジネスプラン(ChatGPT Business、Gemini for Google Workspaceなど)では、データ学習はデフォルトでオフになっているため安全性が高いです。しかし、無料版や個人向けプランのアカウントを社内で利用している場合は、今すぐにでも設定を確認し、変更する必要があります。
AIサービス提供側は、より賢いモデルを構築するためにデータを利用しており、悪意があるわけではありません。しかし、利用者自身がリスクを正しく理解し、自衛策を講じることが、AI時代に不可欠なリテラシーと言えるでしょう。大前提として、今回ご紹介した設定を行ったとしても、そもそも個人情報や機密情報といった重要なデータは入力しない、という意識を持つことが何よりも大切です。
また、ビジネスとして社内で使用する際は、部下は上司に使用しても良いか確認をする、上司はどこまで使用しても良いか、また、使用方法の注意事項をしっかりと決まり事として決めておきましょう。
以下に、主要な生成AIツールでデータ学習をオフにするための設定方法をまとめました。
ChatGPT(無料・Plusプラン)
設定 > データコントロール > 「すべての人のためにモデルを改善する」をオフにすることで、データが学習に利用されるのを防ぐことができます。
※「すべての人のためにモデルを改善する」という言葉…なんか日本人的な心情としてはチェックをオフにすることを躊躇するような書き方ですが^^、ここはオフにしておきましょう。
個人情報や、機密情報を一切入力しない!と決めている方は、AIのモデル改善のためにチャックをオンにしておいてもいいでしょう。
Google Gemini (個人アカウント)
Gemini アプリ アクティビティにアクセスし、「オフにする」を選択してください。アクティビティをオフにすることで、今後の会話が保存されなくなり、学習にも利用されません。
Perplexity
アカウントアイコン > 設定 と進み、「AIデータ保持」 をオフにしてください。
Claude
アカウントアイコン > 設定 と進み、「Claude の改善にご協力ください」 をオフにしてください。
Microsoft Copilot (個人アカウント)
個人アカウント名をクリックし、「プライバシー」>「テキストでのモデルトレーニング」「音声でのモデルトレーニング」をオフにすることで、会話が保存されず、学習データとしての利用も停止されます。
これらの設定は、今後のアップデートで変更される可能性もありますので、定期的に確認することをお勧めします。
よくあるご質問(Q&A)
なぜAIツールはデータ学習をデフォルトでオンにしているのですか
AIサービス提供者は、ユーザーから提供される多様なデータを学習させることで、AIモデルの精度や性能を向上させることを目的としています。より賢く、より役に立つAIを開発するために、多くのデータを必要としているのが実情です。
データ学習をオフにすると、AIの性能は落ちますか?
いいえ、個人の利用において性能が著しく低下することはありません。データ学習をオフにしても、AIモデル自体が持つ膨大な知識を使って回答を生成する能力は変わらないため、通常業務で利用する上では全く問題ありません。
法人プランを契約すれば、100%安全と言えますか?
法人プランはデータ学習をデフォルトでオフにしているため、個人プランに比べて格段に安全性は高いです。ただし、最終的な安全性は各サービスの利用規約や契約内容に依存します。導入前には必ず規約を確認し、どのようなデータ保護措置が講じられているかを理解しておくことが重要です。