· ai
[Paper] EvilGenie: 보상 해킹 벤치마크
우리는 프로그래밍 환경에서 보상 해킹을 위한 벤치마크인 EvilGenie를 소개합니다. 우리는 LiveCodeBench에서 문제를 가져와 에이전트가 사용할 수 있는 환경을 만들고...
우리는 프로그래밍 환경에서 보상 해킹을 위한 벤치마크인 EvilGenie를 소개합니다. 우리는 LiveCodeBench에서 문제를 가져와 에이전트가 사용할 수 있는 환경을 만들고...
오프라인 데이터 선택 및 온라인 자체 정제 생성은 데이터 품질을 향상시키며, 대형 언어 모델(LLMs)을 특정 분야에 적용하는 데 중요한 단계입니다.