작은 조각만 필요하면 전체 dump을 가져오지 마세요

발행: 0개월 전 (2026년 1월 12일 오전 02:46 GMT+9)

7 분 소요

원문: Dev.to

Source: Dev.to

문제: 작은 테스트를 위한 거대한 백업

최근 프로젝트에서 분산 데이터 시스템으로부터 복잡한 PDF 보고서를 생성해야 했습니다.
보고서는 세 개의 테이블에 의존했으며, 각 테이블은 수백만 행을 포함하고 있었습니다.

디버깅을 위해 전체 백업(수백 GB)을 로컬 머신으로 가져오는 것은 시간과 디스크 공간을 낭비합니다.

대부분의 팀은 다음 옵션 중 하나로 시작합니다:

두 방법 모두 규모가 커지면 한계에 부딪힙니다:

어느 순간 명확해집니다: 우리는 전체 산이 아니라 한 조각의 바위만 필요하다.

SQL Server에서는 bcp(Bulk Copy Program)가 대표적인 도구입니다.
200 GB가 넘는 전체 데이터베이스를 이동하는 대신, 디버깅에 필요한 데이터 조각만 추출해 로컬에 재현합니다.

장점	설명
속도	네이티브 바이너리 스트림으로 작업하므로 거대한 `INSERT` 문이 필요 없습니다. 수백만 행을 몇 분 안에 내보내고 가져올 수 있습니다.
안정성	콘솔 유틸리티이므로 무거운 UI 작업에 걸리지 않으며, 빠르게 실행되거나 명확한 오류와 함께 실패합니다.
유연성	전체 테이블 또는 조인·필터가 포함된 임의의 `SELECT` 결과를 내보낼 수 있어, ‑ 필요한 부분만 추출할 수 있습니다. ‑ 쿼리에서 직접 민감한 컬럼을 제외하거나 마스킹할 수 있습니다.

로컬에 스키마 준비 – 마이그레이션을 적용하거나 DDL 스크립트를 실행해 동일한 테이블(구조만)을 생성합니다.
업스트림 환경에서 데이터 조각을 내보냅니다.
```
bcp "SELECT c.Id, c.Name, o.Id, o.Date, o.Total
     FROM dbo.Customers c
     JOIN dbo.Orders o ON o.CustomerId = c.Id
     WHERE o.Date >= '2025-01-01'"
     queryout orders_customers.dat -n -S your-server -T
```
- queryout은 SELECT 결과를 내보냅니다.
- -n은 네이티브(바이너리) 형식을 사용 – 빠르고 압축됩니다.
- -T는 신뢰된 연결을 사용합니다(-U/-P로 교체 가능).
로컬 데이터베이스에 가져옵니다.
```
bcp dbo.OrdersCustomers in orders_customers.dat -n -S localhost -T
```
로컬 스키마에 맞게 여러 파일(테이블당 하나)로 내보내어 가져올 수도 있습니다.
현실적인 볼륨으로 디버깅 – 이제 로컬 데이터베이스에 관련 테이블과 올바른 데이터 형태, 필요 시 수백만 행 규모의 데이터가 들어 있어 전체 백업을 복원하지 않아도 됩니다.

BCP가 모든 문제를 해결해 주는 마법은 아니지만, 다음 조건에 해당한다면:

주당 여러 시간을 절약하고 로컬 디버깅을 훨씬 쾌적하게 만들 수 있습니다.

여러분은 대규모 업스트림 환경에서 로컬 데이터베이스를 어떻게 시드하고 있나요? 전체 백업, BACPAC, 커스텀 시더, 혹은 다른 방법?