Back to Blog

相关文章

阅读更多 »

GPT-5.2-Codex

请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。

评估 chain-of-thought 可监控性

OpenAI推出了一个用于链式思考可监控性的全新框架和评估套件,涵盖了24个环境中的13项评估。我们的发现显示……