[논문] HomeWorld: 제어 가능하고 고밀도 상호작용이 가능한 전체 주택 장면을 생성하는 통합 평면도‑가구 프레임워크

발행: (2026년 6월 5일 AM 01:58 GMT+9)
5 분 소요
원문: arXiv

Source: arXiv - 2606.06390v1

개요

실내 장면 생성은 로봇 시뮬레이션과 현대 인테리어 디자인에 필수적입니다. 그러나 복잡한 레이아웃과 부족한 3D 장면 데이터 때문에 학습 기반 생성이 어려운 상황입니다. 기존 방법들은 주로 수작업 규칙에 의존하거나 개별 하위 작업(예: 평면도 합성 또는 단일 방 가구 배치)에 집중해, 전역적인 일관성·현실감·시뮬레이션 준비성이 부족한 전체 주택 장면을 만들곤 했습니다.

이러한 한계를 극복하기 위해 우리는 실내 장면 합성을 제어 가능한 단계로 분해하는 통합 계층적 프레임워크를 제안합니다:

  1. 평면도 생성 – 30만 개의 실제 주거 평면도로 구성된 대규모 데이터셋을 구축하고, 전체 주택 평면도 생성을 위해 대형 언어 모델을 학습시켰습니다. 상세 설명과 K‑D 트리 기반 표현을 활용해 세밀하고 제어 가능한 평면도 합성이 가능합니다.
  2. 가구 레이아웃 – 생성된 평면도를 기반으로 이미지 생성 모델이 다중 레벨의 이동 시점에서 가구 레이아웃을 초안합니다.
  3. 객체 배치 – 캐비닛, 책상, 식탁 등 지지면 위에 놓이는 작은 조작 가능한 객체들의 레이아웃을 생성해, 구현형 AI 시뮬레이션에 활용합니다.

가구 및 객체 레이아웃 생성 과정에서는 VLM 기반 리파이너가 배치를 반복적으로 교정하고, 3D 생성 모델을 통해 개별 자산을 유연하게 교체할 수 있습니다. 또한 기본 물리 속성, 표면 텍스처, 조명 설정을 추가해 구현형 AI 사용을 위한 파이프라인을 완성합니다.

실험 및 사용자 연구 결과, 우리의 파이프라인이 레이아웃 다양성과 3D 디자인 매력 측면에서 기존 방법보다 우수함을 정량·정성 지표 모두에서 입증했습니다. 생성 파이프라인과 함께 평면도 데이터셋 및 5천 개의 완전 가구 배치된 장면을 커뮤니티에 공개할 예정입니다.

프로젝트 페이지: https://kairos-homeworld.github.io/

주요 기여

  • 연구 분야: cs.CV, cs.AI
  • 전체 주택 실내 장면 합성을 위한 통합 계층적 프레임워크
  • 대규모 평면도 데이터셋(30만 개) 및 5천 개의 완전 가구 배치 장면 공개

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 실내 장면 생성 및 구현형 AI 시뮬레이션 분야에서 컴퓨터 비전(cs.CV)과 인공지능(cs.AI)의 발전에 기여합니다.

저자

  • Wenbo Li
  • Xiaoliang Ju
  • Zipeng Qin
  • Rongyao Fang
  • Hongsheng Li

논문 정보

  • arXiv ID: 2606.06390v1
  • 분류: cs.CV, cs.AI
  • 발표일: 2026년 6월 4일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »