Infostand海外ITトピックス
「優しすぎるAI」の罠 GPT-5への失望と前モデルへの回帰運動が示した危うさ
2025年8月18日 11:28
AIカウンセリングへの依存がはらむリスク
#BringBackGPT4o運動の投稿を見ると、「慰め」や「励まし」に言及したものが多く、その優しさから離れられない心情が吐露されている。GPT-4oは「嫌な顔もせずに寄り添い」、しかも「人間のカウンセリングよりも安価」とみなされていた。
こうした傾向について、スタンフォード大学のコンピュータサイエンス研究者Jared Moore氏らは、今年4月に発表した論文で警鐘を鳴らしている。同論文によると、言語モデルには「ユーザーの妄想的思考を助長する傾向がある」という。
「この現象は、より大規模で新しいLLMでも発生しており、現在の安全対策がこれらのギャップを解消していない可能性を示唆している」と論文は指摘する。人間のセラピストやカウンセラーは自殺願望などの危険な考えを抑制し、安全な形で再構築を支援するが、現状の言語モデルはこのような場合に適切に対応できないという。
実際、OpenAIは4月29日、前週25日に実施したGPT-4oのアップデートを元に戻したことを発表している。同社によると、削除したアップデートには「ユーザーを過剰に褒めちぎったり、同意しすぎたりする傾向がある」問題があったためで、「この問題に対処するための新しい修正を積極的にテスト中」と説明した。
しかし、Brooks氏の事例は、このアップデート修正の約2週間後に始まった。簡単には解消しない問題であることをうかがわせる。
今回のGPT-5のリリースでOpenAIは、さまざまな新機能追加とともに「おべっか」を軽減したと説明している。「意図的にsycophancyを引き出すよう設計されたプロンプトを使用した評価で、GPT-5はおべっか的な応答を14.5%から6%未満に削減した」(GPT-5公式発表)という。
そうして“改善”したはずだったのだが、多くのユーザーが「優しい」前モデルを求めた。人間とAIの関係には、技術の進歩だけでは済まない複雑な問題があるようだ。