인간 편집으로부터 학습하는 AI 챗봇 구축 (피드백만이 아니라)

발행: (2026년 4월 12일 오후 05:07 GMT+9)
4 분 소요
원문: Dev.to

Source: Dev.to

The Problem: Intelligence ≠ Empathy

현대 AI는 방대한 데이터셋으로 학습되고 인간 피드백을 통한 강화 학습(reinforcement learning) 같은 기법으로 다듬어집니다. 대부분의 피드백 시스템은 정확성, 안전성, 전반적인 유용성을 최적화하도록 설계되어 있으며, 감정적 뉘앙스, 공감성, 혹은 “맞는 느낌”을 반드시 반영하지는 않습니다. 다시 말해, 우리는 AI가 옳아지는 것을 훈련시킬 뿐, 이해받는 것을 훈련시키지는 않는 것입니다.

A Different Thought

“이 답변이 정확한가?” 대신에 “이 답변이 사람들에게 맞는 느낌인가?” 라고 물어볼 수 있습니다.
더 중요한 것은, 사람들이 단순히 평가만 하는 것이 아니라 AI의 응답을 직접 다시 쓸 수 있다면 어떨까요?

The Experiment: Letting Humans Edit AI

저는 Crowdians 라는 작은 실험을 만들었습니다.

  • 당신은 자신만의 AI 캐릭터와 채팅합니다.
  • 응답이 마음에 들지 않으면 “Academy” 로 보냅니다.
  • 다른 사용자들이 그 답변을 다시 쓰고, 커뮤니티가 가장 좋은 버전에 투표합니다.
  • 시스템은 이렇게 다듬어지고 인간이 승인한 응답들을 수집합니다.

부정적인 피드백(“이건 나빠”)만 모으는 것이 아니라, 개선된 답변(“이건 더 나아”)을 모으는 것입니다.

Why This Might Matter

대부분의 AI 시스템은 라벨링된 데이터셋, 랭킹 신호, 수동 피드백으로 학습합니다. Crowdians는 응답을 적극적으로 공동 창작(co‑creation)하는 방식을 탐구하며, 사용자를 단순 평가자가 아니라 기여자로 취급합니다—위키피디아나 GitHub와 비슷하지만 AI 답변의 공감성에 초점을 맞춥니다. 가정은 간단합니다: 좋은 답변은 단순히 생성되는 것이 아니라 다듬어지는 것입니다.

Why I’m Sharing This

제가 이 접근법이 옳은지 확신하지 못합니다. 비효율적일 수도 있고, 확장하기 어려울 수도 있으며, 완전히 실패할 수도 있습니다. 그럼에도 현재 AI는 능력은 있지만 깊이 있는 인간성을 자주 놓치고 있기 때문에 탐구해볼 가치가 있다고 느낍니다. 아마도 그 부족한 조각은 혼자서는 학습되지 않을 것이고, 협업이 필요할지도 모릅니다.

Your Thoughts

  • 인간이 편집한 AI 응답을 모델이 만든 것보다 더 신뢰하실 건가요?
  • 공감성을 크라우드소싱할 수 있을까요?
  • 이 방향이 유망한가요, 아니면 근본적으로 결함이 있나요?

시도해보고 싶으시다면 (그리고 깨뜨려 보세요), 여기 있습니다:

Crowdians

어떠한 피드백, 비판, 혹은 파격적인 아이디어도 언제든 환영합니다.

0 조회
Back to Blog

관련 글

더 보기 »