Show HN: AI 지식 작업을 위한 오픈소스 SDK

발행: 2시간 전 (2026년 2월 11일 오전 02:06 GMT+9)

5 분 소요

Source: Hacker News

개요

GitHub:

대부분의 AI 에이전트 프레임워크는 코드를 대상으로 합니다: 코드를 작성하고, 테스트를 실행하고, 오류를 수정하고, 반복합니다. 이는 코드가 자연스러운 검증 신호를 가지고 있기 때문에 가능한데, 코드는 작동하거나 작동하지 않기 때문입니다.

Knowledge Work SDK는 지식 작업을 엔지니어링 문제처럼 다룹니다:

Task → Brief → Rubric (hidden from executor) → Work → Verify → Fail? → Retry → Pass → Submit

오케스트레이터는 서브‑에이전트, 웹 검색, 코드 실행, 파일 I/O를 조정한 뒤, 절대 조작할 수 없는 기준(루브릭은 별도 호출에서 생성되고 실행자는 직접 보지 못함)에 따라 자신의 작업을 검증합니다.

이 SDK는 원래 지식 작업에 대한 RL 훈련용 하니스로 구축되었습니다. 루브릭은 보상 함수 역할을 하여, 일반적으로 보상이 없는 작업에 구조화된 보상 신호를 제공합니다.

SDK는 현재 많은 에이전트가 지식 작업에 대해 부족한 기능을 추가합니다:

예시 저장소를 확인하면 이 차이를 이해할 수 있습니다.

검증 단계가 주요 레버리지를 제공합니다:

원격 실행 환경: Docker, e2b, 로컬 환경, 브라우저 샌드박스 등과 연동됩니다. 모델은 여러분의 컨텍스트에서 명령을 실행하고 피드백 루프를 기반으로 반복합니다. 코드 실행은 프로토콜로 취급됩니다.
툴 호출: 모델이 터미널 코드를 작성하고 피드백을 기반으로 반복할 수 있습니다. 컨텍스트에 함수나 문서를 전달하면, 모델이 필요한 코드를 생성하고 실행합니다(Anthropic의 프로그래밍 툴 호출과 유사). 세부 사항:

MIT 라이선스. 피드백을 환영합니다.

Comments URL:
Points: 4
Comments: 1