评估 chain-of-thought 可监控性
发布: (2025年12月18日 GMT+8 20:00)
1 min read
原文: OpenAI Blog
Source: OpenAI Blog
Overview
OpenAI 推出了一套用于链式思考可监控性的全新框架和评估套件,涵盖 13 项评估,遍及 24 种环境。我们的研究结果表明,监控模型内部推理过程的效果远胜于仅监控输出,这为实现可扩展的协同……
Source: OpenAI Blog
OpenAI 推出了一套用于链式思考可监控性的全新框架和评估套件,涵盖 13 项评估,遍及 24 种环境。我们的研究结果表明,监控模型内部推理过程的效果远胜于仅监控输出,这为实现可扩展的协同……
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
OpenAI 与美国能源部已签署谅解备忘录,以深化在 AI 和先进计算方面的合作,支持科学……
OpenAI 正在更新其 Model Spec,加入新的 Under‑18 Principles,定义 ChatGPT 应如何为青少年提供安全、适龄的指导,基于发展……
周三晚上,OpenAI 推出了 App Directory,供用户浏览当前所有可用的工具,并开放了其 SDK,供开发者构建新的交互式体验。