2天前 · ai 评估 AI 执行科学研究任务的能力 OpenAI推出FrontierScience,一个benchmark,用于测试AI在物理、化学和生物学方面的推理能力,以衡量向真实科学研究的进展……