Show HN: Apple Silicon에서 TRELLIS.2 이미지-투-3D 생성 네이티브로 실행
Source: Hacker News
Overview
Microsoft의 TRELLIS.2 (4 B‑파라미터 이미지‑투‑3D 모델)를 Apple Silicon에서 PyTorch MPS를 이용해 실행하도록 포팅했습니다. 원본은 flash_attn, nvdiffrast, 그리고 커스텀 희소 컨볼루션 커널을 필요로 하는 CUDA가 필수였지만, 이들은 Mac에서 동작하지 않습니다.
Implementation
CUDA‑전용 연산을 순수 PyTorch 대안으로 교체했습니다:
- 희소 3D 컨볼루션을 위한 gather‑scatter 연산
- 희소 트랜스포머를 위한 SDPA 어텐션
- CUDA 해시맵 연산을 대체하는 파이썬 기반 메쉬 추출
총 변경량은 9개 파일에 걸쳐 몇 백 라인에 불과합니다.
Performance
M4 Pro (24 GB)에서 단일 사진당 약 400 K 정점 메쉬를 생성하는 데 약 3.5분이 소요됩니다. H100에서 몇 초 만에 처리되는 속도보다는 느리지만, 클라우드 의존 없이 오프라인에서 작동합니다.
Repository
Discussion
Comments on Hacker News – 138 points, 22 comments.