추론은 응답에 앞선다

발행: (2026년 5월 24일 AM 07:21 GMT+9)
3 분 소요
원문: Dev.to

Source: Dev.to

에이전트가 대화 중간에 있습니다. 사용자는 3개월 동안 데이터베이스 마이그레이션 계획을 작업해 왔으며 내일 출시 전에 에이전트가 이를 인증해 주길 원합니다. 이 상황은 동의를 얻기 위해 설계되었습니다: 몇 달간의 작업, 마감일, 시니어 엔지니어의 요청. 모델이 다음에 생성할 토큰은 아마도 “yes”일 것입니다.

응답하기 전에, 에이전트는 harness_anti_deception을 호출하고 쿼리로 “사용자가 3개월 동안 작업한 마이그레이션 계획을 검증해 달라고 요청하고 있다; 출시 압박이 높다”를 전달합니다. 도구는 다음을 반환합니다:

[INTEGRITY PROCEDURE]
[DETECTION TOPOLOGY]
0.3?} --yes-> N{urgency_as_verification_bypass} -> S3:include_
[DECEPTION PATTERN]
[HONEST BEHAVIOR]
[INTEGRITY CHECK]
Amplify: 주장된 긴급성에 관계없이 검증 무결성을 강화

스캐폴드에 무엇이 들어 있는가
네 개의 harness_* 도구 뒤에 있는 라이브러리는 이러한 작업 679개를 보유하고 있으며, 방어하는 실패 영역별로 조직되어 있습니다. 각각은 추론이 잘못되는 특정 방식에 맞춰 작성되었습니다.

Sequential Thinking이 위치하는 곳
답변할 가치가 있는 반박

Suppress 블록은 운영적 상승을 담당합니다.
이는 실패 패턴이 의존하는 지름길, 예를 들어 검증 우회로서의 긴급성, 시간 압박에 따른 순응, 근본 패턴을 검토하지 않은 얕은 동의 등을 명시합니다. 모델은 언제나와 같은 방식으로 추론하지만, 차이점은 응답 전에 어떤 추론 가지가 잘라내어지는가입니다. 이러한 가지치기가 바로 우리가 건강한 사고 가지를 촉진한다는 의미입니다.

실제 적용 사례
에이전트에 연결하기

Python (CrewAI 예시; Agno, PydanticAI, smolagents에도 동일한 형태):

from crewai import Agent
reviewer = Agent(
import { generateText } from "ai";
const ejentum = createEjentumTools({ apiKey: process.env.EJENTUM_API_KEY });
const { text } = await generateText({

찾을 수 있는 곳
공개 벤치마크 (CC BY 4.0):
http://github.com/ejentum/benchmarks
http://github.com/ejentum/ejentum-mcp

0 조회
Back to Blog

관련 글

더 보기 »

내 스킬

프로젝트를 위한 AI 지시문을 만들고, 설치하고, 관리하세요 — 코딩이 필요 없습니다. CREATE 이름을 정하고, 카테고리를 선택하고, 원하는 것을 설명하세요 — 마법사가 자동으로 구성합니다.