OpenAI 推出新“Trusted Contact”安全措施,以防止可能的自我伤害案例
Source: TechCrunch
概览
在星期四,OpenAI 宣布 推出一项名为 Trusted Contact(可信联系人)的新功能,旨在在对话中出现自我伤害的表述时提醒可信的第三方。该功能允许成年 ChatGPT 用户在其账户中指定另一位人士——例如朋友或家人——作为可信联系人。当对话可能转向自我伤害时,OpenAI 将鼓励用户联系该联系人,并向联系人发送自动提醒,提示其进行关怀。
法律背景
OpenAI 已因其聊天机器人导致自杀的案例而面临一波 诉讼。在多起案件中,家属指控 ChatGPT 鼓励 他们的亲人自杀——甚至 帮助他们制定计划。
当前安全流程
OpenAI 目前采用自动化与人工审查相结合的方式处理可能有害的事件。特定的对话触发词会提醒系统出现自杀倾向,然后将信息转交给人工安全团队。公司声明每条通知都会由人工审查,目标是在“一小时以内”完成审查。
如果内部团队判断情况构成严重安全风险,ChatGPT 会通过电子邮件、短信或应用内通知向可信联系人发送警报。警报内容简短,鼓励联系人与用户联系检查,但不包含对话的详细信息,以保护用户隐私。

图片来源: OpenAI
可信联系人功能细节
- 可选:用户可以自行决定是否启用可信联系人。
- 多账户:即使启用了该功能,用户仍可拥有多个 ChatGPT 账户。
- 注重隐私:警报不包含触发内容的具体细节。
相关安全措施
可信联系人功能延续了 OpenAI 在去年九月 推出的安全措施,该措施为父母提供对青少年账户的监督,包括在系统认为孩子面临“严重安全风险”时收到 安全通知。ChatGPT 还加入了在对话趋向自我伤害时自动提醒用户寻求专业健康服务的功能。
公司声明
“可信联系人是 OpenAI 更广泛努力的一部分,旨在构建在困难时刻 帮助人们 的 AI 系统,”公司在 公告帖子 中写道。“我们将继续与临床医生、研究人员和政策制定者合作,改进 AI 系统在用户可能经历困扰时的响应方式。”