Launch HN: 트랜스로드(YC P26) – CCTV로 화물 물품 측정

발행: 3일 전 (2026년 6월 10일 AM 01:28 GMT+9)

8 분 소요

출처: Hacker News

안녕하세요 HN — 저희는 Julius, Jago, Nils이며, 현재 transload (transload.io)를 개발하고 있습니다.
transload는 LTL 트럭킹 업체들이 터미널에 이미 설치된 보안 카메라를 활용해 화물의 치수를 측정하도록 돕습니다. 전용 치수 측정 스테이션을 거치는 대신, 일반적인 도크 작업 흐름을 통과하면서 자동으로 측정합니다.

HN 전용 데모 사이트를 여기 마련했습니다: https://hn.transload.io/

LTL 트럭킹에서 치수는 가격 책정, 화물 분류, 트레일러 활용도에 직접적인 영향을 미치기 때문에 매우 중요합니다. 만약 운송사가 보고한 것보다 화물이 더 크다면, 운송사는 동일한 트레일러 공간을 차지하면서도 낮은 요금을 청구하게 됩니다. 가장 명백한 해결책은 모든 화물을 측정하는 것이지만, 바쁜 화물 터미널에서는 이것이 생각보다 어렵습니다. 전용 치수 측정 시스템은 통과하는 화물에 대해서는 정확히 작동하지만, 포크리프트 이동 거리를 늘리고, 도크 혼잡을 유발하며, 기존 작업 흐름을 바꾸게 됩니다. 실제로 많은 터미널이 전체 화물 중 일부만 샘플링해서 측정하고 있습니다.

Jago는 가족이 운영하던 LTL 트럭킹 및 크로스‑도킹 사업을 통해 이 산업과 가까이에서 자라왔습니다. 저희는 처음에 화물 치수 측정 시스템을 만들려고 시작한 것이 아니라, 크로스‑도크 터미널 내부에서 포크리프트 경로를 최적화하는 AI 시스템을 구상했습니다. 50개 이상의 트럭킹 회사를 만나고 고객과 이야기를 나누다 보니, 사람들이 가장 많이 언급하는 문제는 포크리프트 경로가 아니라 화물 치수였다는 것을 깨달았습니다.

동시에 공간 AI가 빠르게 발전하고 있었습니다. 단일 카메라 기반 메트릭 깊이 추정이 크게 향상되어, 비싼 LiDAR 센서 없이도 일반 카메라 영상만으로 정확한 3D 구조를 복원할 수 있게 되었습니다. MapAnything(https://github.com/facebookresearch/map-anything)과 MoGe(https://github.com/microsoft/moge)가 그 예시입니다.

화물 터미널은 고정된 카메라, 반복되는 작업 흐름, 바코드 스캔 타임스탬프, 알려진 레이아웃 등 유용한 구조를 가지고 있습니다. 거의 모든 창고에 CCTV가 이미 설치돼 있죠. 그래서 우리는 간단한 질문을 던졌습니다: “기존 보안 카메라만으로, 백그라운드에서 자동으로 화물 치수를 측정할 수 있다면 어떨까?” 이렇게 하면 도크 작업 흐름을 바꾸지 않고도 모든 화물을 측정할 수 있습니다.

저희 시스템은 두 가지 주요 단계로 이루어집니다: 바코드 스캔을 영상 속 올바른 객체와 연결하고, 그 객체의 실제 치수를 추정합니다.

도크 작업자는 이미 일상 업무 중에 화물을 스캔합니다. 각 스캔은 타임스탬프와 핸들링 유닛 ID를 제공합니다. 해당 타임스탬프 주변의 영상을 분석해 어떤 작업자가 어떤 화물을 스캔했는지를 추론합니다. 처음엔 VLM(비전 언어 모델)으로 해결하려 했지만, 신뢰성이 너무 낮았습니다. 대신 우리는 시선, 몸 자세, 움직임 등 3D 단서를 활용해 자체 모델을 학습했습니다.

이 연결 단계는 매우 중요합니다. 한 프레임에 수십 개의 팔레트, 여러 작업자, 포크리프트, 부분적으로 가려진 화물 등이 동시에 존재합니다. 스캔을 잘못된 객체에 연결하면 측정값은 무의미해집니다.

대상 화물을 확인하면, 해당 화물을 세그멘테이션하고 단일 카메라 뷰에서 메트릭 3D 바운딩 박스를 추정합니다. 박스가 맞춰지면 치수는 바로 얻을 수 있습니다: 길이, 너비, 높이, 부피가 직접 계산됩니다.

가장 어려운 부분은 일반 보안 카메라 하나만으로 정확한 3D 박스를 맞추는 일입니다. 2D 이미지 하나만으로는 객체의 형태나 스케일을 직접 알 수 없으며, 비슷해 보이는 이미지 증거를 설명할 수 있는 3D 박스가 여러 개 존재합니다. 우리는 객체 마스크, 보이는 가장자리, 바닥 접촉점, 카메라 기하학, 터미널의 제약 조건 등을 활용해 장면에 가장 잘 맞는 3D 박스를 찾아냅니다.

현재 여러 LTL 운송사와 협업 중이며, 한 고객의 경우 검사된 화물 중 약 10%가 치수 오류를 가지고 있었습니다. 첫 번째 활용 사례는 매출 회복입니다: 차원 오류가 있는 화물을 식별하고 시각적 증거를 첨부해 운송사가 청구서나 분류를 수정하도록 돕는 것이죠. 장기적으로는 이 데이터를 활용해 트레일러 활용도를 더 잘 이해할 수 있습니다.

LTL 화물 분야는 3D 컴퓨터 비전을 적용하기에 특이한 환경이며, 매주 새로운 것을 배우고 있습니다. 단일 카메라 복원, 3D 객체 탐지, 창고 인식, 혹은 복잡한 실제 환경 CV에 경험이 있다면 여러분의 의견을 듣고 싶습니다. 화물, LTL 터미널, 혹은 기술적 접근 방식에 관한 질문도 언제든 환영합니다.

Launch HN: 트랜스로드(YC P26) – CCTV로 화물 물품 측정

관련 글

생물학적 진화와 정보 획득

인간의 관심을 원한다면 인간적인 노력을 보여라

이 재킷, 공기 중에서 식수를 끌어낸다

단순 HTML의 놀라운 효과 (2021)