
ink
구독자 136명구독중 15명
Rationale
지속 가능한 투자
AI 데이터센터에서 병목은 단순히 GPU 성능 부족이 아니라 GPU 간 데이터 이동 속도에서 발생합니다.
대형 AI 모델 학습은 수천 개 이상의 GPU가 병렬로 연산하고, 중간 결과를 계속 교환하는 구조입니다.
이때 GPU 간 통신 지연이 커지면 연산 장치가 데이터를 기다리게 되고, GPU 사용률이 하락합니다.
따라서 AI 클러스터의 성능은 GPU 개수뿐 아니라 네트워크 대역폭, 지연시간, 전력 효율에 의해 결정됩니다.
기존 서버와 랙 내부 연결은 주로 구리 기반 전기 신호를 사용해왔습니다.
구리선은 짧은 거리에서는 비용과 구현 측면에서 유리하지만, 데이터 전송 속도가 높아지고 거리가 길어질수록 신호 손실과 전력 소모가 커집니다.
특히 AI 클러스터가 랙 단위에서 데이터센터 전체 규모로 커지면 구리 기반 연결만으로는 대역폭과 전력 효율을 모두 만족시키기 어렵습니다.
이 한계를 보완하기 위해 광통신, 즉 optical interconnect가 중요해지고 있습니다.
광통신은 전기 신호를 광신호로 변환해 광섬유를 통해 데이터를 전송하는 방식입니다.
광신호는 장거리 전송에서 신호 감쇠가 상대적으로 낮고, 고대역폭 전송에 유리합니다.
AI 데이터센터에서 광통신의 핵심 목적은 단순한 네트워크 속도 향상이 아니라 GPU 간 데이터 이동 병목을 줄이는 것입니다.
병목이 줄어들면 GPU가 연산을 멈추고 ...

좋은 자료 감사합니다.



