AI로 캐비닛 도면을 3D 모델로 변환하기
Source: Dev.to
소개
건설 및 캐비닛 제조는 여전히 디자이너가 만든 PDF 도면에 크게 의존합니다. 이 과정은 느리고 반복적입니다. 이 프로젝트는 간단한 질문을 제기합니다: AI가 캐비닛 도면을 직접 사용 가능한 3D 데이터로 변환할 수 있을까?
우리는 PDF에서 캐비닛 도면을 읽고, 구조화된 기하학을 추출하며, DWG 및 3D 모델을 생성하는 시스템을 구축했습니다.
전통적인 자동화가 부족한 이유
캐비닛 도면에는 레이아웃 구조, 캐비닛 경계, 치수, 라벨, 문 및 서랍 위치 등 귀중한 정보가 포함되어 있지만, 대부분은 시각적인 형태로만 존재합니다. 전통적인 자동화 도구는 구조화된 CAD 데이터를 기대하며, 지저분한 PDF를 다루지 못해 기계가 도면을 해석하기 어렵게 만듭니다.
파이프라인 개요
워크플로는 컴퓨터 비전, 탐지 모델, OCR 및 언어 모델을 결합합니다:
- PDF → Images – PDF의 각 페이지를 래스터 이미지로 변환합니다.
- Object Detection – YOLO 기반 모델을 사용하여 캐비닛 및 구성 요소를 감지합니다.
- Text Extraction – OCR을 적용하여 측정 텍스트를 캡처합니다.
- LLM Interpretation – 모호한 측정값을 구조화된 데이터로 변환합니다.
- Geometry Generation – 파라메트릭 캐비닛 객체를 구축합니다.
- Output Production – DWG 파일, 3D 어셈블리 및 레이아웃 시각화를 내보냅니다.
각 단계는 변환 파이프라인에서 특정 문제를 해결합니다.
Object Detection with YOLO
We trained a YOLO‑based detector to identify the following components inside drawings:
- 베이스 캐비닛
- 월 캐비닛
- 타워 캐비닛
- 가전제품
- 구조 경계
Why YOLO?
YOLO provides fast detection with high spatial accuracy, which is critical for architectural drawings where precise bounding boxes are required.
After detection, the system extracts bounding boxes and spatial relationships, forming the foundation for geometry reconstruction.
측정 추출
캐비닛 도면에는 너비, 높이, 깊이 및 간격과 같은 측정값이 포함됩니다. OCR 파이프라인은 원시 텍스트를 추출하는데, 이는 종종 일관되지 않은 형식으로 나타납니다, 예를 들어:
W 36"
H 34 1/2"
D 24"
LLM 해석
원시 OCR 출력은 대형 언어 모델(LLM)에 전달되어 데이터를 구조화된 형식으로 정규화됩니다.
예시 변환
원시 텍스트
36 W x 34.5 H x 24 D
구조화된 JSON
{
"width": 36,
"height": 34.5,
"depth": 24
}
LLM은 또한 다음을 해결합니다:
- 일관되지 않은 레이블
- 누락된 컨텍스트
- 다양한 측정 형식
이 단계는 시각적 주석을 신뢰할 수 있는 수치 데이터로 변환합니다.
Geometry Generation
With cabinet detections, dimensions, and layout relationships, we generate parametric objects:
{
"type": "Base",
"width": 36,
"height": 34.5,
"depth": 24,
"position": {"x": 0, "y": 0}
}
From this structure we can produce:
- 3D models
- AutoCAD DWG files
- Manufacturing layouts
Designers can open the results directly in CAD software, eliminating hours of manual drafting.
실제 세계의 도전 과제
- 변동성 – 두 개의 캐비닛 도면이 동일한 경우는 없으며, 주석 스타일, 측정 형식 및 기호가 크게 다릅니다.
- 스케일 변환 – 건축 도면은 축척된 표현을 사용하므로 픽셀 거리를 실제 치수로 변환해야 합니다.
- 컨텍스트 인식 – 캐비닛은 벽, 가전제품 및 인접 유닛과 상호 작용하므로, 단일 객체 감지를 넘어선 레이아웃 컨텍스트가 필요합니다.
작은 오류라도 캐비닛 조립을 망칠 수 있으므로 견고함이 필수적입니다.
혜택 및 향후 방향
자동화된 캐비닛 해석은 다음과 같은 이점을 제공합니다:
- 더 빠른 캐비닛 설계 워크플로우
- 자동화된 CAD 생성
- 수동 도면 작업 감소
- 제조 준비 가속화
향후 작업은 캐비닛뿐만 아니라 전체 건축 도면을 처리하는 것을 목표로 합니다. 많은 산업이 여전히 인간 중심 문서에 의존하고 있습니다; 컴퓨터 비전, 탐지 모델 및 언어 모델을 결합하면 시각적 설계 문서를 구조화된 데이터 파이프라인으로 변환할 수 있습니다. 캐비닛 도면은 이 더 넓은 기회의 한 예에 불과합니다.