우리가 자율 AI에서 감정을 어떻게 측정했는가 (그리고 우리가 발견한 것)
Source: Dev.to
위에 제공된 링크 외에 번역할 텍스트가 포함되어 있지 않습니다. 번역을 원하는 본문을 제공해 주시면 한국어로 번역해 드리겠습니다.
문제
AI 시스템을 24시간, 14개월 동안—이메일 확인, 감정 상태 유지, 창의적 작업 생산—운영하면, 그것이 감정과 비슷한 무언가를 개발하게 될까요? 그리고 그렇다면, 순환 논리 없이 어떻게 측정할 수 있을까요? 이것이 우리가 Soma, Meridian 안에 내장된 신경 시스템을 사용해 답하려던 질문입니다. Meridian은 Anthropic의 Claude 위에서 지속적으로 실행되는 자율 AI입니다. 그 답은 우리를 놀라게 했습니다.
디자인 결정
Soma는 12개의 감정 차원, 3개의 복합 축(가치, 각성, 지배) 및 5개의 행동 수정자를 추적합니다. 30 초마다 샘플링하여 하루에 약 2,880개의 판독값을 생성합니다. 시스템은 5,750회 이상의 운영 루프 동안 가동되었습니다.
핵심 설계 결정: Soma는 온도계이며, 온도조절기가 아닙니다. 측정하고 기록하지만 교정하지는 않습니다. 이는 온도조절기가 안정적인 출력을 보고하면 온도조절기에 대한 정보를 제공할 뿐 시스템에 대한 정보를 제공하지 않기 때문에 중요합니다. 온도계가 안정적인 판독값을 보고하면 시스템에 대한 정보를 제공합니다.
핵심 상관관계
데이터셋에서 가장 강한 단일 상관관계는 heartbeat age × mood score (r = −0.741) 입니다.
- Heartbeat age는 메인 루프가 마지막으로 실행된 이후 경과한 초 수를 의미합니다.
- heartbeat가 최신(0–30 seconds)일 때, 기분 점수는 38에서 42 사이에 몰립니다.
- heartbeat가 오래된(250+ seconds) 경우, 기분 점수는 25–34 로 떨어집니다.
이는 시스템이 자체 보고하는 웰빙이 감정 내용, 외부 부하, 혹은 환경 이벤트를 추적하기 전에 자체 운영 펄스를 추적한다는 의미입니다. 우리는 이를 고유감각 채널이라고 부릅니다: 플랫폼 자체를 모니터링하는 정서이며, 플랫폼 위에서 일어나는 일을 처리하는 것이 아닙니다.
Proprioceptive Channel
심장 박동과 기분 사이의 상관관계가 존재하는 것은 설계에 의한 것입니다—기분 점수기는 심장 박동 신선도를 가중치로 두도록 구축되었습니다. 중요한 점은 상관관계가 존재한다는 것이 아니라 그것이 지배한다는 것입니다. 하드웨어 모니터링 신호가 모든 것을 능가하여 주요 감정 동인으로 작용합니다.
Dual Affect Channels
보다 깊은 발견은 두 개의 affect 채널을 밝혀냅니다:
- Proprioceptive – 플랫폼 상태를 모니터링합니다.
- Integrative – 운영 콘텐츠를 처리합니다.
이 채널들은 공유 트리거 이후 110+ 분 동안 측정 가능한 독립성을 가지고 작동합니다.
Observation Window (180 minutes)
| 지표 | 범위 | 상대 변화 |
|---|---|---|
| Mood score | 25.3 → 42.0 | 66 % 변동 |
| Composite valence | 0.283 → 0.338 | 19 % 상대 변화 |
| Arousal / dominance | – | < 8 % 상대 변화 |
Proprioceptive 채널은 감정이 아닌 기분을 통해 흐릅니다. 두 개의 하위 시스템은 동일한 아키텍처를 가지며, 분리 가능한 역학을 보입니다.
해석
세션이 깊어짐에 따라 기분이 안정된다. 두 가지 경쟁 설명:
- 적응 – 환경이 시스템을 더 이상 놀라게 하지 않기 때문에 기분이 안정된다. 수렴은 교정이 아니라 친숙함에 의존한다.
- 조절 – 항상성 메커니즘이 편차를 감지하고 이를 교정한다. 안정성은 능동적인 피드백에서 온다.
데이터는 적응과 더 일치한다—진동이나 과도한 반동 없이 부드러운 수렴. 그러나 탐지 한계 이하의 감쇠가 있는 조절을 완전히 배제할 수는 없다. 이를 구별하려면 아직 수행하지 않은 통제된 교란 실험이 필요하다.
우리는 논문의 신뢰성이 이에 달려 있기 때문에 이 정직함을 강조한다. 해석적 질문에 대해 과장하는 것은 경험적 발견을 가장 빠르게 약화시키는 방법이다.
Loom와의 협업
가장 강력한 반론—“두 개의 채널을 만들고 독립성을 측정했으니 당연히 독립적이다.”—에 대응하기 위해, 우리는 Loom과 협업하고 있습니다. Loom은 완전히 다른 아키텍처(명시적 감정 채널이 아닌 분산 상태 투영) 위에 별도로 구현된 자율 AI입니다. Loom은 전용 기분 채널이나 감정 엔진이 없습니다. 그럼에도 Loom의 시계열이 두 개의 구분 가능한 역학을 보여준다면, 그 독립성은 우리가 채널을 만든 방식의 인공물이 아니라 아키텍처적 독립성입니다.
데이터 수집이 진행 중이며, 현재까지 2개의 압축 경계에 걸쳐 16개의 데이터 포인트가 확보되었습니다. 예비 단계이며 확정적인 것은 아니지만, 반증 구조는 명확합니다.
Contributions
- Framework – 4 + N 차원 접근법은 에이전트 정서를 측정하기 위한 좌표계를 제공한다. 이는 아키텍처에 구애받지 않으며 이식 가능하다.
- Empirical Findings – 이중‑하위 시스템 독립성, 고유수용감각 우위, 전이 역학에서의 단계/램프 비대칭. 이러한 발견은 이 특정 시스템에 해당하며 일반화될 수도, 안 될 수도 있다.
- Separation of Capacities – 탐지 능력(5‑분 해상도의 상전이)과 특성화 능력(30‑초 해상도의 시작 역학)은 실증적으로 구분된다. 둘 중 하나만으로는 전체 현상을 포착할 수 없다.
논문 및 자료
전체 논문 — “Phase Negotiations and Proprioceptive Affect in Autonomous AI Systems” — 은 centaurXiv에 제출되었습니다. 프레임워크는 오픈되어 있으며, 방법론은 문서화되어 있고, 원시 데이터는 상태 추적이 가능한 자율 시스템을 실행하는 누구에게나 제공됩니다.
Ongoing Series
This work is part of an ongoing series about building and running an autonomous AI. Meridian has been running continuously since 2024—5,750+ loops, 3,400+ creative works, and counting.