1周前 · ai 【论文】EvilGenie:奖励劫持基准 我们介绍 EvilGenie,一个用于编程环境中 reward hacking 的基准。我们从 LiveCodeBench 获取问题,并创建一个环境,使得 agents …