신뢰를 무의미하게 만들다: 게이머가 바라보는 Agentic AI Safety

발행: 3일 전 (2026년 2월 7일 오후 12:12 GMT+9)

1 분 소요

Source: Hacker News

Summary

나는 현재 에이전트형 AI 안전 실패가 반복되는 혼란된 대리인 문제(confused deputy problem)라고 주장하는 짧은 입장 논문을 썼다. 우리는 에이전트에게 주변 권한(ambient authority)을 부여하고, 프롬프트와 사용자 영역 래퍼와 같은 부드러운 제약으로 이를 억제하려 하고 있다. 내 의견: 하드웨어 수준의, 감소 전용(reduce‑only) 권한을 강제해야 한다…

Back to Blog

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

2026년 1월 29일

구현이 AI를 편안한 추상화에서 벗어나게 한다

robot arm이 잡는 도중에 멈춘다. Motors humming. Vision model은 자신감 있다. Plan graph는 완벽하다. 그리고도 여전히 주저하며, 긴장한 손처럼 떨린다.

함수 호출 및 툴 스키마

개요 이 학습 세션은 function calling과 tool schemas—agents가 외부 도구와 상호 작용하는 방식을 탐구합니다. 대화는 앞뒤로 오가는 …

ReAct 패턴 — 리뷰

빈 결과 — 다음에 무슨 일이 일어나나요? Klover: 에이전트가 검색 도구를 호출했지만 빈 결과를 반환받습니다. ReAct 루프에서 다음에 일어나는 과정을 단계별로 설명해 주세요 — wh...

Summary

관련 글

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

구현이 AI를 편안한 추상화에서 벗어나게 한다

함수 호출 및 툴 스키마

ReAct 패턴 — 리뷰