VMware vSAN용 네트워크 스위치에서 확인해야 할 사항

발행: (2025년 12월 12일 오후 10:00 GMT+9)
9 min read

Source: VMware Blog

VMware vSAN용 네트워크 스위치를 선택할 때 고려해야 할 사항

올해 초에 발표된 최근 VMware vSAN 네트워킹 시리즈 블로그 게시물 이후 가장 많이 받은 질문 중 하나는 “vSAN 환경에서 Top of Rack(ToR) 네트워크 스위치는 무엇을 사용해야 할까요?” 입니다. 저희의 Broadcom Compatibility Guide (BCG) for vSAN은 vSAN 클러스터를 구성하는 호스트의 호환성 및 요구 사항을 상세히 다루지만, 네트워크 스위치에 대해서는 언급하지 않습니다.

거의 모든 네트워크 스위치는 vSAN과 작동할 수 있지만, 그렇다고 해서 모두가 데이터센터 요구 사항을 충족한다는 뜻은 아닙니다. 최신 하드웨어 교체 또는 새로운 클러스터 구축을 진행할 때 고려해야 할 현대 네트워크 스위치의 특성이 있습니다. 어떤 부분에 주목해야 하는지, 그리고 이러한 사양이 왜 중요한지 살펴보겠습니다.

vSAN에 네트워크 스위치가 중요한 이유

vSAN은 분산 스토리지 솔루션입니다. 클러스터 내 호스트에 데이터를 저장해 데이터 복원력과 가용성을 보장합니다. vSAN 클러스터를 구성하는 호스트는 일관되고 저지연 스토리지를 제공하기 위해 빠르고 신뢰할 수 있는 네트워킹에 의존합니다.

그림 1. vSAN의 분산 스토리지 모델과 네트워킹 의존도.

지난 20년간 서버 하드웨어의 역량이 급격히 증가한 것은 놀라운 일입니다. CPU 코어 수는 32‑128배, RAM도 비슷하게 증가했으며, 최신 NVMe 스토리지 성능은 2,500배 이상 향상되었습니다. 이러한 개선은 애플리케이션의 지속적인 수요 증가에 흡수되었습니다. 관리자는 새로운 하드웨어의 성능을 활용하고 비즈니스 요구에 맞추기 위해 VM에 할당된 가상 리소스를 늘렸습니다.

네트워킹 역시 크게 발전했지만, 더 빠른 네트워킹 필요성에 대한 인식은 크게 뒤처져 있습니다. 예를 들어, 구리 기반 10 GbE 표준은 2000년대 중반에 제정되었고 몇 년 뒤에 보급되었습니다. 서버 하드웨어가 크게 개선된 반면, 많은 고객은 10 Gb가 충분하다고 고집합니다. 실제 데이터센터에서 10 Gb가 활용되기 시작한 지 거의 20년이 지났음에도 말이죠. 25 Gb 또는 100 Gb로 전환을 꺼리는 이유는 종종 4‑10배 정도의 네트워킹 성능 향상이 불필요하다는 근거 없는 주장 때문이며, 같은 기간 동안 다른 하드웨어는 20‑100배 성장했습니다.

현대 25/100 Gb 스위치 비용은 특히 비주류 대안들을 살펴볼 때 매우 낮습니다. 이러한 스위치는 각 랙에 있는 호스트 전체 비용의 아주 작은 비율(한 자리 수)만 차지하지만, 호스트는 스위치의 기능에 크게 의존합니다. 다시 말해, ToR 스위치를 비용 절감 대상으로 삼서는 안 됩니다.

안일한 네트워크 설계는 네트워크를 병목 현상으로 만들 수 있습니다. 이는 어느 환경에서도 문제가 될 수 있지만, vSAN과 같은 분산 스토리지 시스템을 사용할 때 가장 크게 드러납니다. 네트워크가 병목이 되면 vSphere와 vSAN의 정교한 스케줄러에 의존하는 대신, 트래픽이 원시적인 TCP 혼잡 제어 메커니즘에 의해 대기하게 됩니다.

그림 2. 과소 규모 네트워크와 과다 규모 네트워크 비교.

왜 이렇게 문제가 될까요? 네트워크 링크가 포화되면 패킷이 손실되고 재전송이 필요합니다.

그림 3. 네트워크 패킷 손실이 스토리지 성능에 미치는 영향.

그 결과는 VM 스토리지 성능 저하 또는 일관성 부족, CPU·메모리 미활용, 장애 시 복구 시간 증가, 그리고 문제 해결 난이도 상승입니다.

vSAN에 사용되는 ToR 스위치에 대한 권장 사항

vSAN에 적합한 ToR 스위치를 선택하면 일관되고 고성능·저지연 스토리지를 위한 통로를 확보할 수 있습니다. 대부분의 공급업체는 단일 다운링크 포트의 이론적 대역폭(예: “10 Gb 스위치”, “25 Gb 스위치”, “100 Gb 스위치”)으로 스위치를 설명하는데, 이는 성능에 실질적인 영향을 미치는 다른 중요한 요소들을 가립니다.

아래는 실제로 중요한 특성들입니다. 이 정보는 엄격한 최소 사양을 제시하는 것이 아니라, 하드웨어 사양이 진화함에 따라 스위치를 비교하는 데 도움을 주기 위한 것입니다.

다운링크 포트 수와 속도

다운링크 포트 수와 속도는 랙 내 서버에 연결되는 포트 수와 해당 포트의 기본 전송 속도를 의미하며, 일반적으로 포트 수 × 전송 속도 형태(예: “32 × 25 Gb”)로 표기됩니다. 최신 25 Gb 및 100 Gb 스위치는 보통 SFP28 또는 QSFP28 모듈을 사용합니다.

  • 고속 포트는 ToR 스위치 내부에 머무는 vSAN, vMotion 등 클러스터 트래픽에 유리합니다.
  • 다수 포트는 서버에 대한 유연성과 효율성을 높여 줍니다. 예를 들어, 32포트 ToR 스위치 2대를 사용하면 랙당 16대의 호스트를 각각 최대 4포트까지 지원할 수 있고, 48포트 스위치 2대를 사용하면 동일 16대 호스트를 최대 6포트까지 지원할 수 있습니다.

포트 수를 늘릴 때는 스위치가 스파인에 제공하는 총 대역폭을 고려해 적절한 오버서브스크립션 비율을 유지해야 합니다. 자세한 내용은 “vSAN Networking – Network Oversubscription” 게시물을 참고하십시오.

가장 작은 ReadyNode 프로파일에서는 10 Gb 네트워킹이 지원되지만, 우리는 25 Gb를 강력히 권장합니다.

Back to Blog

관련 글

더 보기 »