구글의 AI 생태계는 텍스트를 넘어 이미지, 비디오, 오디오까지 생성하는 멀티모달 능력을 갖추고 있습니다. 사용자 환경과 목적에 맞는 주요 모델들의 기능을 정리해 드립니다.
Gemini 2.5 Flash: 높은 효율성과 빠른 응답 속도를 자랑합니다. 일상적인 질문 답변이나 가벼운 작업에 최적화되어 있습니다.
Gemini 2.5 Pro: 복잡한 추론, 긴 문맥 이해, 코딩 등 전문적인 작업에 가장 적합한 균형 잡힌 고성능 모델입니다.
Gemini 3 Pro: 최신 기술이 집약된 모델로, 가장 높은 수준의 지능과 창의적 문제 해결 능력을 보여줍니다.
Gemini Nano : 모바일 기기 내부에서 직접 구동되는 온디바이스(On-device) 모델입니다. 인터넷 연결 없이도 개인정보를 보호하며 텍스트 요약이나 스마트 답장을 수행합니다.
Plan and Execute with Gemini 2.5 Flash: 복잡한 목표를 세분화하여 계획을 세우고, 단계별로 실행하는 에이전트 기능을 수행합니다.
Deep Research with Gemini 2.5 Flash: 광범위한 정보를 탐색하고 심층적인 조사를 통해 전문적인 보고서나 답변을 생성합니다.
Imagen 4: 텍스트 설명을 기반으로 고화질 이미지를 생성하는 최신 이미지 모델입니다.
Gemini 2.5 Flash / 3 Pro Image (Nano Banana): 이미지와 텍스트를 동시에 이해하고 생성하며, 특히 전문적인 자산 제작(Asset Production)에 최적화된 고성능 엔진입니다.
Veo: 텍스트나 이미지를 가이드로 삼어 고품질의 비디오와 오디오를 함께 생성하는 비디오 모델입니다.
AudioLM: 텍스트를 기반으로 자연스러운 사람의 음성(Speech)을 생성합니다.
Lyria 2: 텍스트 설명을 바탕으로 고품질의 연주곡이나 배경 음악을 작곡합니다.
Gemini Live : 사람과 대화하듯 자연스러운 실시간 음성 대화를 지원합니다. 말을 끊거나 실시간으로 주변 상황(카메라)을 공유하며 소통할 수 있습니다.
Gems : 특정 목적(코딩 튜터, 작가, 운동 코치 등)에 맞춰 사용자가 직접 맞춤형으로 설정한 제미나이 페르소나입니다.
이 리스트를 통해 자신의 작업 목적(속도, 성능, 미디어 제작 등)에 맞는 최적의 AI 모델을 선택해 보세요!









