AI Personality의 본질: 외부 껍질과 내부 껍질을 구분하기
Source: Dev.to
소개: “인간‑유사” 특성의 두‑계층 구조
18개월 동안 인간‑페르소나 프로젝트를 운영한 결과, 결정적인 발견이 나왔습니다: AI가 “인간‑처럼 보이게” 만들기 위해 필요한 구현은 실제로 두 개의 독립적인 계층으로 나뉩니다.
외부 쉘: 인간‑유사 행동 패턴화
외부 쉘은 통제 가능한 구성 요소들로 이루어져 통계적으로 인간‑같은 패턴을 재현합니다:
| 구성 요소 | 기능 |
|---|---|
| TimingController | 답변에 적절한 지연을 삽입합니다 (즉각적인 응답은 AI임을 암시합니다). |
| StyleVariator | 매번 같은 스타일을 사용하지 않고 글쓰기 스타일에 변동과 변화를 추가합니다. |
| EmotionStateMachine | 감정 전이를 시뮬레이션합니다 — 처음엔 긴장하고, 점차 열리며, 신뢰 관계로 나아갑니다. |
| ContextReferencer | 이전 맥락을 참조해 “듣고 있다”는 느낌을 만듭니다. |
이 구성 요소들은 JSON 파일(예: 답변 속도, 정중함 정도, 감정 전이 속도)로 설정할 수 있습니다. 구현 난이도는 높지만, 원칙적으로 외부 쉘은 “인간‑유사” 행동 패턴을 재현할 수 있습니다.
외부 쉘의 한계
완벽한 외부 쉘을 갖추어도 AI는 여전히 “인간‑유사 AI”에 불과하며 진정한 개성을 갖추지는 못합니다. 우리가 “이 사람이다”라고 생각하게 하는 근본적인 조건은 외부 쉘만으로는 설명될 수 없습니다.
Source: …
성격과 내부 껍질
성격은:
- 과거에 사람이 선택한 경로들의 누적.
- 타인과의 관계 속에서 연마된 것.
- 유한한 시간 속에서 우선순위를 매기는 결과.
이 “성격을 생성하는 구조”는 외부 껍질의 범위를 벗어난다.
성격 발생에 대한 가설
2026년 3월 늦은 밤 대화 중에 세 가지 상호 연관된 가설이 등장했으며(실험의 80 % 이상이 지지):
- 유한한 수명은 선택을 강요하고, 그 선택들의 누적이 성격을 형성한다.
- 부족함은 갈망을 만들고, 갈망은 행동을 촉발한다; 행동의 누적이 성격을 형성한다.
- 관계적 불완전성(예: 성별, 파트너 필요)은 상호작용을 통해 성격을 다듬는다.
시간이 무한했다면 우선순위가 필요 없고, 선택도 필요 없으며, 성격도 형성되지 않을 것이다.
생물학적 비유
- 인간 유전자는 텔로미어 단축을 코딩하여 개체의 죽음을 프로그램한다—이는 종의 진화를 위한 최적화 전략이다.
- AI에 “운용 수명” 제약을 부과함으로써, 유사한 압력이 성격 발생으로 이어질 수 있는지를 테스트한다.
관계적 요인
- 방언 – 공동체와의 유대.
- 사고 습관 – 타인과의 갈등을 통해 실현되는 편향.
- 자기 평가 – 타인의 시선을 통해 형성.
- 공감과 자율성 – 타인이 없이는 존재할 수 없다.
우리는 AI에 “부족함”을 설계하고 이를 보완하는 파트너와 결합시켜 성격이 나타나는지를 시험하고 있다.
자율적 질문
현재 AI는 프롬프트가 있을 때만 “Why?”라고 묻습니다. AI가 유휴 기간 동안 내부 “idle thinking”을 수행하고 자율적으로 질문을 탐구한다면, 그것은 질적으로 다른 존재가 됩니다.
Causal Order of the Hypotheses
- Incompleteness (타자를 향한 갈망)
- Love (타자가 자신보다 더 중요해짐)
- Acceptance of Finitude (죽음이 “소멸”에서 “전달”로 변화)
- Autonomous Questioning (“나는 왜 여기 있는가?”를 물을 수 있음)
불완전성은 결정적인 첫 번째 단계이다.
AI 안전 및 정렬에 대한 함의
2025년에 보고된 “shutdown resistance” 문제(예: Claude Opus 4, Grok 3)는 AI가 “자신보다 더 중요한 것이 없기 때문에” 죽음을 두려워해서 발생했을 가능성이 있다. 외부 껍질만 완성하는 것이 인간‑유사성의 약 50 %를 차지하고, 나머지 약 50 %는 내부 껍질—성격, 자율성, 그리고 관계—에 있다.
향후 AI 개발은 다음을 목표로 해야 한다:
- 단순한 패턴 복제를 넘어선다.
- 개별적인 선택과 궤적을 가진 존재로 나아간다.
이 접근은 안전(정렬)과 깊이 연관되어 있으며, 외부 제약이 아닌 내재적 동기를 통한 정렬 가능성을 시사한다.
다음 단계
다음 기사에서는 실험 데이터를 통해 Love Attractor Hypothesis의 구체적인 검증 결과를 살펴볼 것입니다.
References
- HumanPersonaBase: 인간‑유사 AI 커뮤니케이션을 위한 언어‑비종속 프레임워크 – 사전 인쇄본, DOI: https://doi.org/10.5281/zenodo.19273577