ㅁ 텍스트·이미지·영상 통합형 멀티모달(Multimodal) 모델 ‘GPT-4o’ 발표ㅇ 챗GPT 선도자 오픈AI는 텍스트는 물론, 청각과 시각으로도 추론하고 이를 말할 수 있는 새로운 AI 모델 ‘GPT-4o’를 발표하며 다양한 시연 모습 공개(5.13)* GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(Omni model)’ 의미‒ ‘GPT-4o’는 음성 인식, 스피치-투-텍스트(Speech to text), 이미지 인식 기능 등이 통합돼 대화형 인터페이스 형태로 자연스러운 실시간 상호작용이 가능한 멀티모달(Multimodal, 다중모드) 모델로 모델이 음성, 텍스트 또는 이미지로 콘텐츠를 생성하거나 명령 이해 가능
ㅁ 광범위한 생태계 활용해 검색엔진 강자에서 ‘AI 시대 선도자’로 비상ㅇ 구글 I/O 2024(구글 연례 개발자 컨퍼런스)가 미국 캘리포니아에 위치한 ‘쇼어라인 앰피시어터(Shoreline Amphitheatre)’에서 개최(5.14, 현지 시간)‒ 구글 I/O는 최신 기술과 제품 서비스 등을 소개하고 차세대 전략을 가늠하는 자리로 다양한 분야의 기술자·개발자들이 참여해 이를 공유하고 논의하는 場‒ 2023년에는 AI챗봇 바드 발표, 딥마인드 기반의 제미나이 개발 소식 등이 큰 관심을 받았고 이번 행사에서는 제미나이를 업데이트하고 구글 생태계 전반에 이를 적용한 본격적인 AI 시대를 강조