[Paper] Generative AI가 건축 개념 설계에 미치는 영향: 성과, 창의적 자기 효능감 및 인지 부하
Source: arXiv - 2601.10696v1
Overview
이 논문은 생성 AI(GenAI) 도구—예를 들어 GPT‑4 스타일의 이미지 생성기나 텍스트‑투‑이미지 모델—가 설계 초기 개념 단계에서 건축가들의 품질, 자신감, 그리고 정신적 노력에 어떤 영향을 미치는지 조사한다. 36명의 대학생을 대상으로 통제된 실험을 수행한 결과, 저자들은 GenAI가 초보자들의 성과를 향상시킬 수 있지만, 동시에 디자이너들의 창의적 역량에 대한 자신감을 약화시킬 수도 있음을 보여준다.
주요 기여
- 실증 평가: 실제 건축 설계 워크플로우에서 GenAI(독립 작업 → GenAI‑지원 vs. 대조) 사용.
- 성능 분석: 초보 디자이너에게 유의미한 이점이 있음을 보여주지만, 전체적인 향상은 다소 제한적.
- 심리적 통찰: GenAI 사용이 전반적인 창의적 자기 효능감을 감소시키지만, 과제별 자신감은 유지됨.
- 인지 부하 결과: 전체적으로 차이는 없지만, 특정 프롬프트 전략(반복 아이디어 생성 및 시각적 피드백)이 인지 부하 감소와 연관됨.
- 차분 차이(DiD) 프레임워크 설계: GenAI 효과를 시간에 따른 학습 효과와 분리함.
방법론
- 참여자 – 건축공학 전공 및 기타 전공 학생 36명, 두 그룹으로 나눔.
- 과제 – 두 단계로 구성된 건축 개념 설계 과제:
- 1단계: 독립적으로 설계 (기본 조건).
- 2단계: (a) GenAI 도구(예: DALL‑E, Midjourney)를 사용해 개념을 생성하거나, (b) 기존 프로젝트가 모여 있는 온라인 저장소를 탐색(통제).
- 측정 항목 –
- 설계 성과: 창의성, 실현 가능성, 일관성에 대해 전문가 건축가가 평가.
- 창의적 자기 효능감: 각 단계 전후에 자신의 창의적 능력에 대한 자신감을 자가 보고.
- 인지 부하: 각 단계 후 NASA‑TLX 스타일 설문지 사용.
- 분석 – 차분 차분(Difference‑in‑differences, DiD) 방법으로 조건 간 변화 비교, 그리고 사전 설계 경험에 따른 하위 그룹 분석.
이 접근법은 의도적으로 단순하게 설계되었습니다: 참여자는 평소와 같이 작업하고, 영감의 출처(AI vs. 인간이 선별한 아카이브)만이 변합니다. 이를 통해 일상적인 설계 도구에 대한 결과 적용이 용이합니다.
결과 및 발견
| 지표 | 전체 효과 | 주목할 만한 하위 효과 |
|---|---|---|
| 디자인 성능 | 전체 표본에서 GenAI에 대한 통계적으로 유의한 이점이 없었습니다. | 신입 디자이너(이전 프로젝트 ≤2개)는 GenAI를 사용할 때 전문가 점수가 ~15 % 상승했습니다. |
| 창의적 자기 효능감 | GenAI 그룹에서 평균 ~8 % 감소했습니다 (p < 0.05). | 경험 많은 디자이너는 자기 효능감을 유지했으며, 감소는 신입 디자이너에 의해 발생했습니다. |
| 인지 부하 | GenAI와 대조군 조건 사이에 유의한 차이가 없었습니다. | 반복적 정교화와 시각적 피드백을 포함하는 프롬프트 패턴(예: “show me variations of this façade”)은 인지 부하가 낮은 것으로 연결되었습니다. |
| 프롬프트 사용 | 대부분의 참가자는 디자인 반복당 3–5개의 프롬프트를 사용했습니다. | 텍스트 설명과 시각적 참조 프롬프트를 결합한 사용자가 가장 큰 성능 향상을 달성했습니다. |
요약하면, 적절한 프롬프트 전략과 함께 사용할 때 GenAI는 초보자에게 힘을 증폭시키는 도구이지만, 동시에 사용자가 창의적으로 덜 능력 있다고 느끼게 할 수도 있습니다.
실용적 함의
- 도구 설계자: 반복적인 정제와 시각적 피드백 루프를 장려하는 prompt‑suggestion UI를 삽입하세요; 이는 인지적 마찰을 줄이고 결과를 개선할 수 있습니다.
- 디자인 회사 및 스튜디오: 시니어 건축가에게 전반적인 생산성 향상 도구로 제공하기보다 주니어 직원들을 위한 training aid로 GenAI를 도입하는 것을 고려하세요.
- AI‑assisted CAD/BIM 플랫폼 개발자: 모델의 “confidence” 또는 “novelty” 점수를 공개하여 사용자가 AI가 기존 아이디어를 재조합하는 수준인지 진정으로 새로운 개념을 생성하는지 판단할 수 있게 하세요.
- 교육: 커리큘럼은 prompt engineering을 핵심 역량으로 가르쳐야 하며, 단일 “final answer”를 요구하기보다 변형과 시각적 힌트를 요청하는 방법을 강조해야 합니다.
- 프로젝트 관리: 프롬프트 사용 지표(반복 횟수, 프롬프트 유형)를 인지 부하의 대리 지표로 추적하고, 팀이 단일 프롬프트 스타일에 과도하게 의존하고 있을 경우 개입하세요.
전반적으로, 연구는 context‑aware integration—AI와 인간 전문성을 결합하고 올바른 프롬프트 습관을 갖추는 것이—가 가장 큰 가치를 제공한다는 것을 시사합니다.
제한 사항 및 향후 연구
- Sample size & diversity: 단일 대학의 36명 학생만; 결과가 전문 건축가나 문화 간 팀에 일반화되지 않을 수 있음.
- Tool specificity: 연구에서는 단일 상용 GenAI 모델을 사용했으며; 도메인 맞춤형 또는 멀티모달 시스템에서는 성능이 다를 수 있음.
- Short‑term assessment: 인지 부하와 자기 효능감은 작업 직후 측정했으며; 장기 효과(예: 기술 습득, AI 의존도)는 아직 알 수 없음.
- Future directions: 실무 건축가를 대상으로 한 대규모 현장 연구, 기술 개발의 장기 추적, AI 출력 유형(스케치 vs. 3D 모델)을 다양화하는 실험을 통해 모달리티가 창의적 자신감에 미치는 영향을 조사.
저자
- Han Jiang
- Yao Xiao
- Rachel Hurley
- Shichao Liu
논문 정보
- arXiv ID: 2601.10696v1
- 분류: cs.AI
- 출판일: 2026년 1월 15일
- PDF: PDF 다운로드