게시물 내용
GPT-4o가 출시되면 애플이 웃는 이유는 안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다. 오픈AI가 새로운 멀티모달 모델 GPT-4o(옴니)을 공개했습니다. 텍스트, 이미지, 오디오 등 인풋을 지원하는데요 기존 모델에서 오디오와 비전 인식 기능이 대폭 개선되었습니다. 마치 똑똑한 인공지능 비서가 옆에 있는 것 같은데요 기술적 부분을 살펴보면 3단계로 구성된 기존 Voice 모델과 다르게 하나의 엔드 투 엔드 뉴럴 네트워크를 통한 프로세싱으로 레이턴시를 줄이고 정보 소실을 방지했습니다. 단순히 모델만 공개한게 아니라 빠르게 만나볼 수 있다는 점도 중요합니다. 텍스트와 이미지 기능은 챗GPT에 바로 탑재해 제공할 예정이며, 무료 유저도 활용할 수 있습니다(제한이 있지만) 개발자를 위한 API도 제공됩니다. GPT-4 터보 대비 2배 빠르지만 절반의 가격으로 rate 리밋은 5배로 상향되었습니다. 발표 전 어느 정도 기대감을 부여했는지에 따라 개인이 느끼는 특별함도 상이할 텐데요, 샘 알트먼이 언급한 영화 Her의 인공지능 수준은 아니지만 관련 기술의 발전에는 위대한 한 걸음입니다. 강화된 성능을 생각하면 자연스럽게 AI 비서와 휴머노이드 로봇이 떠오르게 되네요 미라 무라티 CTO가 라이브 말미에 언급한 것 처럼 이번 발표는 신규 모달리티와 제품 공개에 초점이 맞춰져 있습니다. 다만 Next Frontier에 대한 연구도 지속하고 있다고 말한 만큼 차세대 모델에 대한 기대감도 여전히 유효하다고 판단합니다. 이번 발표로 인한 최대 수혜는 의외로 애플이 될 가능성이 높습니다. 최근 양사가 최종 딜 체결 보도가 나오는 만큼 GPT-4o의 시리 탑재도 무르익고 있습니다. 실시간 음성인식 비서는 모바일과 결합에서 파급력이 더욱 커집니다. 향후 어떤 식의 계약 구조인지가 흥미로운 부분이 될 것입니다. 다만 마이크로소프트도 기본적으로는 긍정적입니다. GPT-4o 급의 성능을 구현하기 위해서는 클라우드 베이스를 활용할 필요가 있고, API 활용에 따른 수혜도 기대해볼 수 있기 때문입니다. 자세한 내용은 발간된 보고서를 참고해주시기 바랍니다. 보고서 링크: https://bit.ly/4afJC5v (2024/5/14 공표자료)