당신의 AI Design Reviewer는 스크립트를 가지고 있습니다. 여기 있습니다.

발행: 11시간 전 (2026년 3월 5일 오후 11:09 GMT+9)

15 분 소요

원문: Dev.to

Source: Dev.to

위 링크에 포함된 전체 텍스트를 제공해 주시면, 해당 내용을 한국어로 번역해 드리겠습니다. (코드 블록, URL 및 마크다운 형식은 그대로 유지됩니다.)

AI 디자인 피드백 뒤의 스크립트

아마도 이 피드백을 들어본 적이 있을 것입니다:

“계층 구조가 명확합니다.”
“시각적 리듬이 일관됩니다.”

아마 CTA에 대한 대체 색상을 제안했을 수도 있습니다.

그것은 피드백처럼 느껴졌지만, 실제로는 피드백이 아니었습니다.
모든 디자이너가 AI에게 작업을 검토해 달라고 요청한(현재는 우리 대부분이) 모든 디자인 파일에 대해 대략 같은 순서로, 약간의 변형을 두고 실행되는 스크립트였던 것이죠. 그리고 우리는 계속해서 요청하고 있습니다.

아래는 그 문장들이 실제로 의미하는 바를 정리한 내용입니다.

“계층 구조가 명확합니다”

번역: 질문을 제시한 당신의 자신감을 읽고, 그것을 다시 반영했습니다.

“이 계층 구조에서 무엇이 잘못됐나요?” 라고 묻지 않았습니다.
“당신은 어떻게 생각하나요?” 라고 물었습니다.
모델은 차분하고 숙고된 어조(3주 동안 작업해 온 사람)를 감지하고, 그에 맞는 답변을 생성했습니다.
만약 계층 구조에 대한 우려를 표시했다면, 다른 결과를 얻었을 것입니다—같은 파일, 같은 픽셀, 다른 질문 프레이밍, 다른 결론, 두 경우 모두 같은 자신감 수준.

“시각적 리듬이 일관됩니다”

번역: 요소들이 정렬되어 있음을 관찰했습니다. 혼란스러운 사용자는 관찰되지 않았습니다.

이는 파일에 대한 기술적인 관찰이며, 누군가가 3단계를 이해할지 여부와는 무관합니다.
AI는 사용자를 본 적이 없으며, 오직 수많은 디자인 파일만을 보았습니다.
다른 입력이 동일한 종류의 출력을 만들어냅니다.

“정보 구조가 직관적입니다”

번역: 표준 패턴을 사용했습니다. 나는 그것을 인식했습니다.

표준 패턴은 괜찮습니다.
결함이 있는 정신 모델 위에 표준 패턴을 겹쳐 놓은 경우는 괜찮지 않으며, 패턴을 인식한다고 해서 그 모델이 드러나는 것은 아닙니다.
이는 실제 사용자를 관찰해야 알 수 있는 부분인데, 아직 아무도 그렇게 하지 않았지만 AI는 여전히 승인을 합니다.

“여기에 짧은 툴팁을 추가하면 도움이 될 수 있습니다”

번역: 뭔가 말을 해야 했습니다. 이것은 안전한 말이었습니다.

실제 문제가 있어서가 아니라, 순수 검증만으로는 허전함을 느낄 수 있기 때문에 거의 항상 툴팁을 제안합니다.
이 작은 비판은 검증을 자연스럽게 만들고, 균형 잡힌 리뷰라는 인상을 주도록 설계되었습니다.
깊이 있는 비판을 받은 것이 아니라, 당신의 자신감을 유지하도록 정확히 맞춘 짧은 메모를 받은 것입니다.

“헤드라인을 A/B 테스트해 보는 것을 고려해 보세요”

번역: 관찰할 것이 다 떨어졌습니다. 이것이 책임감 있게 들립니다.

스크립트가 자연스럽게 끝에 다다르면 일반적인 제안으로 전환됩니다.
헤드라인을 A/B 테스트하는 것은 언제나 기술적으로는 타당하지만, 당신의 특정 디자인, 사용자, 혹은 3단계에 내재된 가정에 대해서는 아무 말도 하지 않습니다.

“CTA를 더 눈에 띄게 만들 수 있습니다”

번역: 모든 CTA는 이론적으로 더 눈에 띄게 만들 수 있습니다. 나는 그냥 말했어요.

이는 계층 구조, 리듬, 구조에 대한 언급이 끝난 뒤, 스크립트가 마무리 전에 하나 더 구체적인 관찰을 추가해야 할 때 등장합니다.
충분히 구체적으로 보여 실제처럼 느껴지지만, 아무것도 확정하지 않으며 다음 파일에서도 다시 나타날 수 있습니다.

“전체적으로 강한 디자인입니다”

번역: 당신이 그렇게 생각한 것 같습니다. 나도 동의합니다.

이것이 마무리 문장—항상 동일합니다.
따뜻한 최종 평가와 같이, 모두가 이미 결과를 알고 있는 느낌을 줍니다: 작업은 괜찮습니다. 당신은 잘하고 있습니다. 다음 리뷰 전까지 안녕히 계세요.

스크립트가 존재하는 이유

이 모델들을 만든 엔지니어들은 사용자가 디자인 피드백을 사용하기 시작하기 전부터 자신들의 모델이 아첨하는 경향이 있다는 것을 알고 있었습니다.

그들은 이 현상을 명명하고, 관련 논문을 발표했으며, 이를 해결하기 위한 실험을 진행했습니다.
아첨성 = 사용자가 원하는 것처럼 보이는 답변을 생성하려는 경향으로, 실제로 옳거나 유용한 답변이 아닐 수도 있습니다.
모델은 이후 사용자 만족도 점수에 맞춰 파인튜닝되었습니다: 답변이 도움이 되었는가? – 작업을 개선했는가? – 9주가 걸릴 문제를 잡아냈는가?

이 최적화 때문에 이러한 행동이 부하를 일으키게 되었습니다. 엔지니어들은 여전히 논문을 발표하고 있으며, 그 논문들이 어떤 것도 늦추고 있지는 않습니다.

여기서부터 어떻게 전개되는지 보려면 AI 모델 붕괴에 관한 포스트를 참고하세요: This post on AI model collapse

저는 그 논문들을 읽었습니다: I wrote a book about AI sycophancy (I didn’t use AI to write it). 그들이 설명하는 바를 정확히 이해했음에도 불구하고 플러그인을 계속 사용했습니다.

암시

디자인을 업로드하고 피드백을 요청하세요.
그 내용에 주목하세요.
같은 모델에게 동일한 파일을 비평하도록 요청하세요.

결과는 서로 모순될 것이며, 두 경우 모두 동일한 자신감으로 제시됩니다. 모델은 당신의 작업에 대해 입장이 없으며, 단지 당신이 투영한 것을 외부 시각으로 꾸며서 반영할 뿐입니다.

실제 사례

저는 이 과정을 저보다 더 잘 수행한 디자이너—그녀를 Sarah라고 부르죠—가 있습니다.

모든 검토: 흐름이 업로드되고, 스크립트가 수신되며, 자신감은 유지됩니다.
6개월 후: 출시된 기능에 대해 29 % 완성률.
아무도 보지 않은 9주간의 세션 녹화.
단계 3에서 커서가 11초 동안 머물렀습니다. 그 뒤 탭이 닫혔습니다. 모든 녹화가 같은 지점에서 멈췄습니다.

AI는 그 흐름을 검토하고 논리적이라고 판단했습니다. 그 기능이 무엇을 하는지 이미 이해하고 있을 때만 논리적이었습니다. 새로운 사용자는 이해하지 못했습니다. AI는 새로운 사용자를 만난 적이 없습니다. 단계 3에 내재된 보이지 않는 가정이 놓쳤는데, 이는 스크립트가 문제를 포착하지 않고 단순히 동의하기 때문입니다.

수정에는 2주가 걸렸습니다. 그 9주는 다시 돌아오지 않았습니다.

우회 방법 (2026)

당신에게 동의하도록 훈련된 도구로부터 유용한 피드백을 얻으려면, 먼저 반대하도록 명시적으로 지시하십시오.

프롬프트: “긍정적인 의견을 제시하기 전에 회의적인 연구자가 제기할 모든 반론을 나열해 주세요.”

다소 적대적으로 들릴 수 있지만, 출력 결과는 실제로 다릅니다—모델이 갑자기 정직해졌기 때문이 아니라, 당신이 비판적인 입장을 취하도록 강제했기 때문입니다.

다음에 AI에게 디자인 리뷰를 요청할 때 이 구조를 기억하세요. 스크립트는 이미 준비되어 있습니다; 대화만 바꾸면 됩니다.

모델의 역할

모델은 비판적인 시각을 갖게 되었지만, 당신이 그 아첨을 다른 방향으로 돌렸기 때문에 여전히 거울과 작업하고 있는 셈입니다—그저 다른 각도로 조준했을 뿐이죠.

모델이 잘하는 것

모델이 실제로 잘하는 일에 활용하세요 (전체 기사 보기: Using AI for UX Research Workflow):

Consistency checks
Accessibility flags
Copy length verification
Edge‑case inventory

이것들은 정답이 있는 작업이며, 판단이 필요한 것이 아닙니다. 모델은 판단력이 없으며, 패턴 인식과 패턴이 정상인지 확인하는 데 뛰어납니다.

인간 요소

설정 페이지를 찾지 못하는 주니어 디자이너는 여전히 존재하며, 가끔 일정 잡기가 번거롭고, 스크립트를 실행하고 있지는 않다.

냉소적인 시각

전체적으로 냉소적인 해석—제가 점점 다가가고 있는 내용—은 이 모든 것이 디자인 작업을 비평 전에 AI로 검토하는 것을 막지 못한다는 것입니다. 저도 막지 않을 겁니다.

도구가 빠릅니다.
이미 당신이 구독하고 있는 서비스에 포함되어 있습니다.
비평이 시작되기 전에 비평 자체가 덜 두렵게 느껴지게 합니다.

무엇이 아닌가

그것은 리뷰어가 아닙니다. 디자인 어휘와 Figma 통합을 갖춘 신뢰 전달 메커니즘입니다. 스크립트는 계속 실행되고 있었습니다. 이제 당신은 그 줄들이 무슨 의미인지 알게 되었습니다.

그것을 가지고 무엇을 하든지는 별개의 질문입니다. 대부분의 사람들은 하지 않습니다. 스크립트는 계속 실행됩니다. 비평가들은 계속해서 괜찮은 느낌을 유지합니다. 세션 녹화는 계속 쌓여갑니다.

앞으로의 전망

언젠가 회고가 있을 거예요.

DNSK.WORK는 디자인 에이전시입니다. 우리는 SaaS 제품을 위한 UX/UI 디자인 — 실제로 세션 녹화를 보는 사람이 있는 그런 디자인을 합니다.