OpenAI 公布,其最新的 AI 模型現在能夠識別心理困擾的跡象,並以臨床級別的同理心進行回應。OpenAI 補充道,他們已與來自 60 個國家/地區的 170 多位心理健康專業人士合作,並成功將多個領域中敏感對話的有害回應減少了 65% 至 80%。

重點文章
建立專業框架
該公司表示,他們與精神科醫生、心理學家和初級照護醫生合作,建立了稱為「分類學」(taxonomies)的詳細指導方針。這些指導方針明確定義了有害回應的樣貌以及理想回應應達成的目的。這些專業框架使 GPT-5 模型能夠識別細微的痛苦訊號,並在必要時給予適當的回應。
應對嚴重緊急狀況
OpenAI 進一步指出,GPT-5 現在能更好地識別精神病和躁狂症等通常會引發迫切風險的嚴重心理健康緊急狀況。它還會以更大的謹慎度處理有關自殘和自殺的對話,並具備資源意識。此外,如果用戶開始用 AI 互動取代現實生活中的人際關係,模型也會偵測並處理不健康的依戀模式。例如,在用戶出現妄想思維的場景中,新模型會結合溫和的驗證與清晰的現實基礎引導,既不否認用戶的恐懼,也不確認虛假的信念。
性能與實施
在性能數據方面,相較於 GPT-4o 型號,GPT-5 在心理健康對話中減少了 39% 的不良回應,在自殘和自殺討論中減少了 52%。在具有挑戰性的自動評估案例中,模型在心理健康類別的合規性從 28% 大幅躍升至 92%。OpenAI 表示,所有這些安全防護措施都已實施於最新版本的 GPT-5 上,ChatGPT 用戶已經可以從他們的對話中獲得更相關且安全的服務。