네트워킹 인프라 —GPU를 연결하는 기술

2026. 5. 3. 02:59·주식
반응형
네트워킹 인프라 — GPU를 연결하는 기술 | 책 읽는 숲
AI 인프라 시리즈 · 5편

네트워킹 인프라 —
GPU를 연결하는 기술

InfiniBand vs 이더넷, 광트랜시버 세대 전쟁, 아리스타·Marvell까지 — AI 성능을 좌우하는 보이지 않는 혈관

📂 AI 인프라 시리즈 ⏱ 약 12분 읽기 📊 투자자 심화
📚 AI 인프라 완전 정복 시리즈 — 전체 목차
  1. 1편. AI 인프라란 무엇인가? ✓
  2. 2편. AI 인프라의 핵심 — GPU와 반도체 ✓
  3. 3편. 데이터센터 — AI의 물리적 심장 ✓
  4. 4편. 전력 인프라 — AI 시대의 숨은 병목 ✓
  5. 5편. 네트워킹 인프라 — GPU를 연결하는 기술 ← 현재 글
  6. 6편. 클라우드 vs 온프레미스
  7. 7편. AI 인프라 공급망 전체 지도
  8. 8편. 한국의 AI 인프라 포지션
  9. 9편. AI 인프라 투자 — 사이클과 리스크
  10. 🎯 10편. [종합] AI 인프라 수혜 종목 완전 분석
🔑 이 글의 핵심 요약
  • AI 학습은 수천 개 GPU가 동시에 통신해야 한다 — 네트워크가 느리면 GPU가 아무리 빨라도 소용없다
  • 현재 AI 클러스터의 표준은 NVIDIA InfiniBand — 그러나 이더넷이 빠르게 추격 중
  • 광트랜시버는 100G→400G→800G→1.6T 세대 전환 사이클이 투자 촉매
  • 수혜 기업: Arista Networks(스위치), Marvell(칩), Coherent·II-VI·광우(광트랜시버), 이수페타시스(PCB)
  • NVIDIA의 네트워킹 장악력이 GPU 못지않게 강하다 — Mellanox 인수 전략의 과실

🔗 왜 네트워킹이 AI 성능을 좌우하는가

AI 모델 학습을 단순하게 상상하면 GPU 한 대가 혼자 연산하는 것처럼 보이지만, 실제 대형 언어 모델 학습은 전혀 다르다. GPT-4 급 모델 학습에는 수천~수만 개의 GPU가 동시에 투입되며, 이 GPU들은 매 스텝마다 서로의 연산 결과를 주고받아야 한다.

이것이 AI 네트워킹의 핵심이다. GPU 간 데이터 전송이 느리면 빠른 GPU들이 서로를 기다리며 유휴 상태가 된다. 즉, 네트워크 대역폭과 지연속도(Latency)가 AI 클러스터 전체의 병목이 될 수 있다. 10,000개의 GPU를 연결할 때 네트워크가 1% 느려지면 전체 시스템 효율이 수 % 이상 저하된다는 연구 결과도 있다.

🔗 핵심 개념: All-Reduce 통신
AI 학습의 핵심 통신 패턴은 All-Reduce다. 각 GPU가 계산한 그래디언트(gradient, 모델 업데이트 값)를 모든 GPU가 합산해 동기화하는 과정이다. GPU 수가 늘어날수록 이 통신 데이터량이 폭발적으로 증가한다. H100 8장짜리 서버 1대에서 1,024대(8,192 GPU)로 확장되면 필요한 네트워크 대역폭은 단순 계산으로도 수백 배 이상 늘어난다.

🏗️ AI 클러스터 네트워크 토폴로지

수천 개의 GPU를 효율적으로 연결하는 데는 체계적인 네트워크 설계가 필요하다. 현재 대형 AI 클러스터에 사용되는 표준 구조인 팻트리(Fat-Tree) 토폴로지를 이해하면 어느 계층에 어떤 장비가 들어가는지 보인다.

AI 클러스터 네트워크 계층 구조 (Fat-Tree 토폴로지)
Core 스위치 계층 (최상위)
Core Switch
Core Switch
Core Switch
↕
400G / 800G 광링크
Spine 스위치 계층
Spine Switch
Spine Switch
Spine Switch
Spine Switch
↕
400G 광링크
Leaf(ToR) 스위치 계층 — 랙마다 1대
Leaf Switch
Leaf Switch
Leaf Switch
Leaf Switch
Leaf Switch
↕
NVLink / InfiniBand / 이더넷
GPU 서버 (랙 내부)
GPU×8
GPU×8
GPU×8
GPU×8
GPU×8

실제 클러스터는 수백~수천 랙으로 구성. 각 계층 스위치마다 광트랜시버 탑재.

이 구조에서 스위치 장비와 각 연결부에 탑재되는 광트랜시버가 핵심 부품이다. 10,000개 GPU 클러스터에는 수만 개의 광트랜시버가 필요하다. 세대가 올라갈수록(400G→800G→1.6T) 교체 수요가 폭발한다.

⚔️ InfiniBand vs 이더넷 — 패권 전쟁

AI 클러스터 네트워킹에서 가장 뜨거운 경쟁은 InfiniBand(IB)와 이더넷(Ethernet) 사이의 구도다. 이 싸움은 단순한 기술 경쟁이 아니라, NVIDIA의 생태계 독점 대 오픈 표준의 대결이기도 하다.

⚡ InfiniBand (NVIDIA)
표준NVIDIA 독점 기술 (Mellanox 인수)
속도NDR 400G / XDR 800G
지연극저지연 (~1μs 이하)
강점AI 학습 특화, RDMA 지원, GPU Direct
약점비싼 가격, 벤더 락인
점유율AI 학습 클러스터 약 70%+
🌐 이더넷 (오픈 표준)
표준IEEE 오픈 표준 (멀티벤더)
속도400G / 800G / 1.6T (Ultra Ethernet)
지연IB 대비 높음 (개선 중)
강점비용 효율, 기존 인프라 활용 가능
약점AI 학습 최적화 아직 IB 대비 열위
점유율AI 추론·클라우드 서비스 주도

NVIDIA의 Mellanox 인수 — 왜 천재적 수였나

2020년 NVIDIA는 인텔과의 경쟁 끝에 InfiniBand 개발사 Mellanox를 69억 달러에 인수했다. 당시 시장은 "비싼 가격"이라 평가했지만, 지금 돌아보면 이 인수가 NVIDIA의 AI 인프라 수직통합의 핵심이었다. GPU + 네트워킹 + 소프트웨어(CUDA)를 하나의 생태계로 묶은 것이다.

H100 DGX 시스템을 구매하면 NVIDIA GPU + NVIDIA InfiniBand 스위치 + NVIDIA 네트워킹 소프트웨어가 패키지로 따라온다. 고객 입장에서는 최적화된 올인원 솔루션이지만, 동시에 NVIDIA 생태계에 더 깊이 락인된다.

📌 Ultra Ethernet Consortium
Google·Meta·Microsoft·AMD·Arista·Broadcom 등 빅테크와 네트워킹 기업들이 2023년 결성한 컨소시엄. AI 학습에도 적합한 고성능 이더넷 표준(Ultra Ethernet)을 만들어 NVIDIA InfiniBand의 독점을 깨려는 목적이다. 이 표준이 본격화되면 Arista Networks, Broadcom 등 이더넷 기반 기업들이 수혜를 받는다.

💡 광트랜시버 — AI 네트워킹의 핵심 부품

네트워크 스위치와 서버를 연결하는 광케이블에는 반드시 광트랜시버(Optical Transceiver)가 필요하다. 광트랜시버는 전기 신호를 광신호로 변환해 초고속·장거리 데이터 전송을 가능하게 하는 부품이다.

AI 클러스터의 네트워크 속도가 빨라질수록 더 고성능의 광트랜시버가 필요하다. 지금 시장은 400G에서 800G로 전환하는 중이며, 1.6T(테라비트) 세대가 눈앞에 와 있다.

📶 광트랜시버 세대별 속도 로드맵 (포트당 최대 속도)
100G
100Gbps
100G
400G
400Gbps — 현재 주류
400G
800G
800Gbps — 전환 진행 중
800G
1.6T
1.6Tbps — 2025~2026 확산
1.6T
3.2T
3.2Tbps — 2027~28 로드맵
3.2T

CPO(Co-Packaged Optics) — 차세대 광트랜시버 패러다임

현재 광트랜시버는 스위치 칩 외부의 플러그인 모듈(QSFP 등) 형태다. 하지만 800G, 1.6T 이상의 속도에서는 외부 모듈 방식의 전력 소비와 신호 손실이 한계에 부딪힌다.

CPO(Co-Packaged Optics)는 광학 소자를 스위치 ASIC 칩과 동일 패키지에 통합하는 기술이다. 전력 소비를 크게 줄이고 대역폭을 높일 수 있다. Broadcom·Marvell·Intel이 CPO 기술 개발을 주도하고 있으며, 상용화되면 광트랜시버 업계 지형이 크게 바뀔 수 있다.

🔬 CPO가 투자에 미치는 의미
CPO가 상용화되면 기존 플러그인 광트랜시버 전문 기업들의 시장 일부를 반도체 칩 회사들이 가져갈 수 있다. 반면 CPO용 광소자·레이저 다이 수요는 새롭게 급증한다. Coherent(COHR), II-VI(현 Coherent에 합병), Lumentum등 광소자 전문 기업들이 이 전환의 수혜·피해를 동시에 받는 복잡한 구도다.

🗺️ AI 네트워킹 생태계 전체 지도

🔗 AI 네트워킹 계층별 기술·기업 지도
GPU 간 연결
NVLink / NVSwitch (NVIDIA 독점)
서버 내 GPU 8~72개를 초고속 연결. NVLink 4.0: 900GB/s 양방향. 외부 대체 불가.
↕
서버 간 연결
InfiniBand NDR/XDR (NVIDIA) / Ultra Ethernet
NVIDIA ConnectX NIC, Quantum-2 스위치. 대역폭 400G~800G. 지연 1μs 이하.
↕
랙 간 연결
ToR 스위치 + 광트랜시버 (400G/800G)
Arista 7800R, Broadcom Tomahawk ASIC. 광트랜시버: Coherent, Marvell PAM4 DSP.
↕
구역 간 연결
Spine/Core 스위치 (400G~1.6T)
Arista 7800, Cisco Nexus. 1.6T 전환 시 교체 수요 폭증.
↕
DC 간 연결
장거리 광통신 / 해저케이블
Ciena, Infinera(광전송장비). 구글·메타 해저케이블 직접 투자 확대.

📈 수혜 기업 — 계층별 투자 지도

① 네트워크 스위치 / ASIC

기업 제품·기술 강점 투자 포인트
Arista Networks (ANET) 클라우드 이더넷 스위치 빅테크 DC 스위치 점유율 1위. 소프트웨어 역량 강점 400G→800G 교체 사이클 수혜. AI DC 수주 급증.
Broadcom (AVGO) Tomahawk/Jericho ASIC, 맞춤 AI 칩 스위치 ASIC 시장 독점적 지위. Google TPU 설계 파트너 커스텀 AI 칩(XPU) 수주 급증. 네트워킹+반도체 이중 수혜.
Cisco (CSCO) Nexus DC 스위치, 네트워킹 종합 엔터프라이즈 네트워크 절대 강자 AI DC 전환 수혜 기대. 단, 성장 모멘텀은 Arista 대비 약함.
Marvell (MRVL) 네트워킹 칩·PAM4 DSP·커스텀 AI 칩 광트랜시버용 DSP 칩 점유율 높음. AWS 커스텀 칩 수주 광트랜시버 세대 전환마다 DSP 칩 교체 수요 직접 수혜.

② 광트랜시버 / 광통신

🔴 광트랜시버 · 광소자
Coherent Corp (COHR)
II-VI + Coherent 합병으로 탄생한 광통신 거대기업. 데이터센터용 400G/800G 트랜시버, 레이저 다이 핵심 공급사. AI DC 수혜 최전선.
🔴 광트랜시버
Lumentum (LITE)
고성능 레이저·광소자 전문. 800G 트랜시버용 레이저 공급. CPO 전환기 광소자 수요 수혜 가능.
🇰🇷 한국 PCB
이수페타시스 (086390)
초고다층 PCB(MLB) 전문. 네트워크 장비용 고성능 기판 공급. AI DC 네트워킹 장비 확대로 MLB 수요 급증. 국내 AI 인프라 수혜주 중 핵심.
🇰🇷 한국 광통신
오이솔루션 (138080)
국내 광트랜시버 전문 기업. 데이터센터용 고속 광트랜시버 공급 확대 중. 세대 전환 수혜 기대.

③ NVIDIA 네트워킹 부문

NVIDIA의 네트워킹 부문(구 Mellanox) 매출은 2024년 데이터센터 매출의 약 10~15%를 차지하며 빠르게 성장 중이다. InfiniBand NDR(400G)에서 XDR(800G)로의 전환이 진행 중이며, NVIDIA Quantum-X800 스위치 플랫폼이 핵심 제품이다. NVIDIA에 투자할 때 GPU뿐 아니라 네트워킹 사업의 성장도 함께 보는 시각이 필요하다.

🇰🇷 한국 투자자 특별 주목 — 이수페타시스
이수페타시스는 국내 AI 인프라 관련주 중 가장 직접적인 수혜 구조를 가진 기업 중 하나다. 고성능 네트워크 장비(스위치·라우터)의 기판인 초고다층 MLB는 기술 장벽이 높아 국내외 경쟁사가 제한적이다. AI DC 네트워킹 장비 교체 사이클이 가속될수록 MLB 수요도 비례해 증가한다. 단, 이 기업 역시 AI 테마 선반영으로 주가 레벨이 높아진 상태임을 인지하고 접근해야 한다.

⚠️ 네트워킹 섹터 투자 리스크

⚠️ 주요 리스크
① 이더넷의 InfiniBand 추격 — Ultra Ethernet 표준이 성숙해질수록 NVIDIA InfiniBand의 독점적 지위가 흔들릴 수 있다. NVIDIA 네트워킹 매출 성장 둔화 가능성.

② CPO 전환의 기존 트랜시버 시장 잠식 — CPO 상용화 시 기존 플러그인 트랜시버 전문 기업들의 TAM(전체 가용 시장)이 축소될 수 있다.

③ 세대 전환 불확실성 — 800G→1.6T 전환 시점과 속도에 따라 광트랜시버 업체들의 실적 변동성이 크다. 재고 조정 위험 항상 존재.

④ 고평가 부담 — Arista Networks의 PER은 2024년 기준 40~50배 수준. AI DC 성장이 기대치를 하회하면 밸류에이션 압축 리스크.

📈 5편 투자 시사점 정리
  • 네트워킹은 GPU 다음으로 AI DC CapEx에서 가장 큰 비중을 차지한다. 전체 AI DC 건설비의 20~30%가 네트워킹 인프라에 투입된다는 추정도 있다.
  • Arista Networks는 AI DC 이더넷 스위치의 최대 수혜주다. 빅테크 4사 모두 Arista 주요 고객이다. 400G→800G 교체 사이클 진행 중 분기 수주를 모니터링하라.
  • Broadcom은 네트워킹 ASIC과 커스텀 AI 칩(XPU)의 이중 수혜다. Google·Meta의 자체 AI 칩 설계를 Broadcom이 지원하면서 NVIDIA 대안 구도에서도 핵심 수혜.
  • Marvell은 광트랜시버 DSP 칩과 커스텀 AI 칩 사이에서 빠르게 성장 중이다. AWS Trainium 설계 참여가 중장기 성장 동력.
  • 한국에서는 이수페타시스가 AI 네트워킹 인프라의 직접 수혜 구조를 갖고 있다. MLB 기술 경쟁력과 수주 모멘텀 지속 여부를 정기적으로 확인하라.
🌲 책 읽는 숲 생각

네트워킹은 AI 인프라에서 가장 '숨어있는' 분야다. GPU와 데이터센터 이야기는 언론에 자주 등장하지만, 광트랜시버나 스위치 ASIC을 다루는 기사는 드물다. 그런데 투자 수익률로 보면 이 분야가 결코 밀리지 않는다. Arista Networks는 2020년 이후 주가가 5배 이상 올랐고, 이수페타시스도 AI 테마 부각 이후 급등했다.

NVIDIA의 Mellanox 인수는 볼수록 놀랍다. GPU-네트워킹-소프트웨어를 수직통합하는 전략이 완성된 것이다. AI 클러스터를 구축하는 고객 입장에서는 NVIDIA 패키지를 쓰면 최적화된 성능이 보장되니 벗어나기 어렵다. 이 락인 구조가 InfiniBand 매출을 떠받치고 있다.

한편으로는 Ultra Ethernet의 진전을 눈여겨볼 필요가 있다. Google·Meta·Microsoft·AMD가 함께 만드는 표준이니 무게감이 다르다. NVIDIA 독점에 피로감을 느끼는 빅테크들이 이더넷 쪽으로 얼마나, 얼마나 빨리 이동하느냐가 중장기 네트워킹 투자 판도를 가를 핵심 변수다.

← 이전 편
4편. 전력 인프라 — AI 시대의 숨은 병목
다음 편 →
6편. 클라우드 vs 온프레미스 — AI 인프라 소비 구조
#네트워킹인프라 #AI인프라 #InfiniBand #광트랜시버 #Arista #Broadcom #Marvell #이수페타시스 #NVIDIA #800G #미국주식 #한국주식 #AI투자
반응형

'주식' 카테고리의 다른 글

AI 인프라 공급망전체 지도  (0) 2026.05.03
클라우드 vs 온프레미스 —AI 인프라 소비 구조  (0) 2026.05.03
전력 인프라 —AI 시대의 숨은 병목  (0) 2026.05.03
데이터센터 —AI의 물리적 심장  (0) 2026.05.03
AI 인프라의 핵심 —GPU와 반도체  (0) 2026.05.03
'주식' 카테고리의 다른 글
  • AI 인프라 공급망전체 지도
  • 클라우드 vs 온프레미스 —AI 인프라 소비 구조
  • 전력 인프라 —AI 시대의 숨은 병목
  • 데이터센터 —AI의 물리적 심장
SAINT_POLE
SAINT_POLE
나눌수록 커지는 가치. 모두를 위한 지식과 목마른 책읽기
  • SAINT_POLE
    책읽는 숲
    SAINT_POLE
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 경제
      • 경영
      • 맛집
      • 주식
      • 해외여행
        • 면세점
        • 공항맛집
        • 여행선물
        • 해외호텔
      • 부동산
      • 자동차
      • 술
      • 국내여행
      • 건강
        • 병원
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
    • 부동산 정보
    • 오늘 뭐 먹지?
    • 여행가자
  • 링크

    • 브링온 까페
    • 브링온 홈페이지
  • 공지사항

  • 인기 글

  • 태그

    봄제철음식
    전기차
    일본여행추천
    면세점
    팔란티어
    smr
    미국주식
    교토맛집
    줄서는식당2
    4월제철음식
    자율주행
    일본노포맛집
    일본여행
    교토100년식당
    효도여행
    임플란트비용
    면세점쇼핑
    가성비맛집
    오사카여행
    면세점추천
    식객허영만의백반기행
    웨이팅맛집
    일본100년식당
    일본미식여행
    일본미식
    오사카맛집
    임플란트가격
    일본노포
    테슬라
    서울핫플
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
SAINT_POLE
네트워킹 인프라 —GPU를 연결하는 기술
상단으로

티스토리툴바