TGTGInsighttelegram intelligenceLIVE / telegram public index
← Ryu일무이
Ryu일무이 avatar

TGINSIGHT POST

Post #3584

@ryu1moo2

Ryu일무이

조회수160게시물 조회수
게시됨3월 11일2026. 03. 11. AM 08:28
내용

게시물 내용

BofA) 엔비디아; GTC’26 프리뷰: 특화된 AI 추론 엔진의 등장, 목표가 $300 뱅크오브아메리카의 최근 보고서는 엔비디아의 GTC 2026 컨퍼런스를 앞두고 매수 투자의견과 목표주가 300달러를 유지한다고 발표했습니다. 이 보고서는 특히 2027년에서 2028년 사이의 가시성과 새롭게 공동 설계된 언어 처리 장치 및 광학 기술에 주목하고 있습니다. 주요 관심 분야로는 2028년 파인만 GPU를 통한 제품 파이프라인 업데이트, 추론 프리필을 위한 CPX 및 저지연 디코딩을 위한 언어 처리 장치 등 맞춤형 제품군, 그리고 CPO 통합 스위치와 같은 독자적인 스케일업 광학 기술이 포함됩니다. 비록 2027년에서 2028년에 대한 공식적인 매출 전망이 발표되지는 않을 것으로 보이지만, 누적 매출 5천억 달러를 기록한 블랙웰의 성공에 이어 루빈의 생산 확대와 관련된 정보는 현재 선행 주가수익비율 17배 수준으로 저평가된 주가에 긍정적인 영향을 미칠 수 있습니다. 새로운 제품 포트폴리오와 관련하여 엔비디아는 표준 학습용 베라 루빈 NVL72, 프리필용 루빈 CPX, 그로크의 SRAM 기반 저지연 디코드용 언어 처리 장치, 긴 컨텍스트 디코드를 위한 ICMSP, 배치 처리용 베라 CPU 등을 발표할 것으로 예상됩니다. 특히 2027년 루빈 울트라 또는 2028년 파인만을 위해 카이버 스타일 랙 내부에 통합된 언어 처리 장치가 첫 선을 보일 가능성이 높습니다. 또한 루빈 플랫폼과 연동되는 차세대 102.4T 스펙트럼-6 스위치와 CPO 기반의 115T 퀀텀-X에 대한 추가적인 정보도 공개될 전망입니다. 더 나아가 기업용 데이터센터 및 소비자용 시장에서의 채택 확대를 위해 인텔과 맞춤형 x86 CPU에 대한 공동 발표가 있을 수도 있습니다. 지정학적 리스크, 중동 갈등이 수요와 공급에 미치는 영향, 연간 제품 출시에 맞춘 공급망 확보, 총마진, 오픈AI 및 앤스로픽 등에 대한 현금 사용처 등도 이번 컨퍼런스에서 지켜봐야 할 주요 관전 포인트입니다. 특히 그로크의 언어 처리 장치는 이번 기조연설의 핵심 주제 중 하나가 될 것으로 보입니다. 엔비디아는 2025년 12월 24일에 200억 달러를 투자하여 그로크의 추론 기술 자산을 인수하는 비독점 라이선스 계약을 체결한 바 있습니다. 이 칩은 처음부터 추론 작업에 특화되어 설계되었으며, 배치 크기와 무관하게 항상 동일한 사이클을 보장하는 결정론적 지연 시간을 특징으로 합니다. 기존 가속기와 달리 외부 고대역폭 메모리를 사용하지 않고 칩 내부에 약 230MB의 대용량 SRAM을 탑재하여 외부 메모리로 인한 병목 현상을 원천적으로 제거했습니다. 내부 패브릭을 통해 초당 80TB의 엄청난 온칩 대역폭을 제공하여 초저지연을 실현하며, 병렬 배치 작업에 유리한 일반 GPU와 달리 순차적인 대규모 언어 모델 디코딩에 최적화되었습니다. 이 칩은 14나노 공정으로 제작되며 CoWoS와 같이 공급이 제한되고 값비싼 패키징 기술을 사용하지 않는다는 장점도 갖추고 있습니다. 결과적으로 언어 처리 장치는 GPU 대비 초당 토큰 처리 속도와 전력 효율성 측면에서 최대 10배 뛰어난 성능을 발휘하여 단일 스트림이나 소규모 배치 추론 작업에 매우 이상적인 솔루션입니다. 인공지능 디코드 과정은 프리필 단계 이후 모델이 한 번에 하나의 새로운 토큰을 생성하면서 시작되는데, 각 토큰이 이전의 모든 토큰과 프롬프트에 의존하기 때문에 매우 순차적이고 산술적인 특성을 지닙니다. 디코드 작업은 메모리 대역폭에 크게 의존하며, 모델이 메모리에서 연산 장치로 끊임없이 이동해야 하므로 대역폭이 전체 시스템 성능에 결정적인 역할을 합니다. 긴 컨텍스트를 처리할 때는 메모리 용량 부족으로 인한 캐시 축출 문제가 발생할 수 있으며, 이를 극복하기 위해 HBM 용량 추가, 캐시 압축, 또는 새로운 메모리 계층으로의 오프로드와 같은 전략이 필요합니다. 반면 짧은 컨텍스트 모델의 경우 대역폭과 지연 시간이 중요하므로 그로크의 방식처럼 칩 내부의 SRAM을 사용하여 시스템 효율성을 극대화하는 것이 효과적입니다. 이러한 기술적 우위를 바탕으로 엔비디아는 향후 카이버 스타일의 랙에 최대 256개의 언어 처리 장치를 연결하는 차세대 추론 랙을 선보일 가능성이 높으며, 이는 결정론적 실행에 필수적인 완벽한 클러스터 동기화와 초저지연 상호 연결을 목표로 합니다. 밸류에이션 측면에서 엔비디아는 현재 2027년 예상 실적 기준 주가수익비율 16에서 17배에 거래되고 있으며, 이는 역사적 중간값인 28.5배에 비해 현저히 낮은 상태입니다. *Gemini로 요약함