Post #1103

@globaltechmoon

[삼성 문준호의 반도체를 전하다]

조회수1,420게시물 조회수

게시됨10월 27일2025. 10. 27. PM 02:35

내용

게시물 내용

[삼성 문준호의 반.전] 퀄컴 AI 반도체 보도자료 요약 Qualcomm은 오늘 데이터센터를 위한 차세대 AI 인퍼런스 최적화 솔루션인 Qualcomm AI200과 Qualcomm AI250를 공개했습니다. 이 두 제품은 칩 기반 가속 카드와 랙(rack) 솔루션 형태로 제공되며, 고성능-저전력 구조를 통해 대형 언어모델(LLM), 다중모달 모델(LMM) 등 생성형 AI(Generative AI)의 인퍼런스 워크로드를 위해 설계되었습니다. AI200은 랙단위의 AI 인퍼런스 솔루션으로, 카드 당 최대 768 GB LPDDR 메모리를 지원하여 높은 메모리 용량을 확보함으로써 유연한 확장성과 낮은 TCO(총소유비용)를 제공하도록 설계되었습니다. AI250은 메모리 근접연산(near-memory computing) 아키텍처를 적용한 후속 제품으로, 카드 당 동일한 768 GB 메모리를 유지하는 한편 **10배 이상 향상된 유효 메모리 대역폭(effective memory bandwidth)**과 현저히 낮아진 전력소모를 강조하고 있습니다. 두 솔루션 모두 직수냉각(direct liquid cooling), PCIe 기반 확장(scale-up), 이더넷 기반 확장(scale-out), 기밀 컴퓨팅(confidential computing) 지원, 랙 단위 전력소비 약 160 kW급 등을 특징으로 합니다. Qualcomm은 이 제품들이 연간 제품 출시를 포함하는 데이터센터용 AI 인퍼런스 로드맵의 일환이라고 밝히며, AI200은 2026년, AI250은 2027년 상용화를 목표로 하고 있습니다. 또한 개발자와 기업들이 이미 훈련된 AI 모델을 주요 프레임워크(PyTorch, TensorFlow 등) 위에서 쉽고 빠르게 배포할 수 있도록 원클릭(one-click) 모델 배포, 풍부한 소프트웨어 스택 및 개방 생태계(open ecosystem)를 강조했습니다. https://www.qualcomm.com/news/releases/2025/10/qualcomm-unveils-ai200-and-ai250-redefining-rack-scale-data-cent