AI 분석👩‍💻/신규 뉴스

구글, Gemini 제미나이 2.0, 멀티모달 AI 시대를 여는 혁신 모델 공개

테크걸A 2025. 3. 23. 13:18

구글이 인공지능 경쟁에서 앞서기 위해 새로운 AI 모델 Gemini 2.0을 발표했습니다. Gemini 2.0은 이미지와 오디오를 생성하고, 더욱 빠르고 효율적인 AI 에이전트를 위한 기반을 제공합니다. 이번 글에서는 Gemini 2.0의 주요 기능과 향후 AI 시장에 미칠 영향을 자세히 살펴보겠습니다.

 

Gemini 2.0이란 무엇인가?

Gemini 2.0은 구글의 기존 Gemini 모델을 대폭 업그레이드한 멀티모달 AI 모델입니다. 기존의 텍스트 기반 기능 외에도 이미지 및 오디오 콘텐츠를 생성할 수 있게 되었으며, 특히 AI 에이전트 기술에 특화되어 있습니다.

핵심 기능 살펴보기

  • 멀티모달 기능: 텍스트뿐만 아니라 이미지와 오디오까지 생성 가능.
  • 속도 및 비용 효율성: 이전 Pro 모델 대비 성능과 효율성 대폭 향상.
  • 에이전트 기반 기술: 프로젝트 아스트라(Astra) 및 프로젝트 마리너(Mariner)를 통해 사용자를 대신해 실제 작업을 수행 가능.

아래 관련 아티클을 통해 자세한 내용을 알아보았습니다.


구글, 사실상 모든 작업을 위한 새로운 AI 모델 'Gemini 2.0' 출시

2024.12 

 

구글의 최신 AI 모델이 맡아야 할 임무는 많다. 다른 모든 회사들이 그러하듯 구글 역시 AI를 자사 제품 대부분에 빠르게 통합하고 있으며, 다른 개발자들이 사용하고 싶어 할 제품을 구축하고, 이러한 것들이 회사를 파산시키지 않을 만큼 저렴하게 돌아갈 수 있도록 인프라를 구축하기 위해 경쟁하고 있다. 한편, 아마존, 마이크로소프트, 앤스로픽, 오픈AI 등도 거의 같은 문제들에 수십억 달러를 쏟아붓고 있다.

 

이러한 배경이 바로 구글 딥마인드 CEO이자 구글 전체 AI 프로젝트를 총괄하고 있는 데미스 하사비스(Demis Hassabis)가 새로운 Gemini 2.0 모델의 전방위적 역량에 크게 흥분하고 있는 이유다. 구글은 Gemini 1.5를 처음 발표한 지 약 10개월 만인 수요일(12월 11일)에 Gemini 2.0을 출시한다. 현재는 구글이 “실험적 미리보기” 단계라고 부르는 수준이며, 상대적으로 작고 성능이 낮은 버전인 Gemini 2.0 Flash만 공개된다. 그러나 하사비스 CEO는 이번 출시가 매우 중요한 의미를 가진다고 강조했다.

 

 

하사비스는 “사실상 현재의 Pro 모델만큼 좋은 성능을 가지고 있다”며, “즉, 같은 비용 효율성과 성능 효율성, 속도를 유지하면서도 완전히 한 단계 업그레이드된 모델이라 생각하면 된다”고 말했다. Gemini 2.0은 기존 모델이 하던 작업들을 더 잘할 뿐만 아니라, 완전히 새로운 기능도 지원한다. 이 모델은 이제 오디오와 이미지를 자체적으로 생성할 수 있으며, 새로운 멀티모달 기능을 통해 AI 분야의 차세대 혁신으로 꼽히는 AI 에이전트(agent)의 기반을 마련한다.

 

소위 ‘Agentic AI’라고 불리는 AI 에이전트란 실제로 사용자를 대신해 업무를 수행할 수 있는 인공지능 봇을 말한다. 구글은 봄부터 ‘프로젝트 아스트라(Project Astra)’라는 시각 기반 시스템을 시연해왔는데, 이 시스템은 사물을 인식하고, 주변 환경에서 사용자를 안내하며, 안경을 어디에 뒀는지 알려줄 수 있다. 하사비스는 Gemini 2.0이 아스트라의 성능을 크게 개선했다고 밝혔다.

 

구글은 또한 사용자의 웹 브라우저를 문자 그대로 대신 사용할 수 있는 실험적 크롬 확장 프로그램 ‘프로젝트 마리너(Project Mariner)’를 함께 발표했다. 또한 개발자가 나쁜 코드를 찾고 수정하도록 도와주는 전용 에이전트 ‘줄스(Jules)’, 화면을 보고 비디오 게임을 더 잘 플레이하도록 도와주는 새로운 Gemini 2.0 기반 에이전트도 등장한다. 하사비스는 게임 도우미 에이전트를 “이스터 에그(Easter egg)”라고 표현하면서도, 이처럼 진정한 멀티모달 모델이 사용자에게 제공할 수 있는 다양한 가능성의 예시라고 강조했다.

 

하사비스는 “2025년이 AI 에이전트 시대의 진정한 출발점이 될 것이라 생각하며, Gemini 2.0은 그 토대”라고 말했다. 그는 모델 성능 향상이 이번 업그레이드의 유일한 성과는 아니라며, 업계 전반에서 AI 모델 성능 향상이 점차 둔화되고 있다는 우려에도 불구하고 구글은 여전히 모델 학습 과정에서 상당한 개선을 보고 있다고 밝혔다. 그러나 그가 특히 더 주목하는 부분은 Gemini 2.0의 효율성 및 속도 개선이다.

구글의 목표는 Gemini 2.0을 가능한 모든 곳에 활용하는 것이다. Gemini 2.0은 현재 약 10억 명이 이용하고 있는 구글 검색의 AI 오버뷰(AI Overviews) 기능을 강화할 예정이다. 구글에 따르면 이 기능은 Gemini 2.0 덕분에 더 미묘하고 복잡한 검색 결과를 제공할 수 있게 된다. 또한 Gemini 봇과 앱은 물론, 궁극적으로는 구글 워크스페이스 및 기타 구글 제품 전체의 AI 기능도 Gemini 2.0 기반으로 운영된다. 구글은 다양한 기능을 각 제품별로 독립적으로 운영하는 대신, 가능한 한 많은 기능을 하나의 근본적이고 범용적인 Gemini 모델에 통합하는 것을 목표로 하고 있다. 하사비스는 “가능한 가장 범용적인(general) 모델을 구축하려 한다”고 말했다.

 

AI 에이전트 시대가 시작됨에 따라 하사비스는 새로운 문제와 기존의 문제가 모두 존재한다고 강조했다. 기존 문제는 성능과 효율성, 추론(inference) 비용과 같은 영원히 해결해야 할 과제다. 새로운 문제는 아직 잘 알려지지 않은 미지의 영역이다. 그중 하나를 꼽자면, 에이전트들이 스스로 외부 세계에서 활동할 때 발생할 수 있는 안전성 문제다. 구글은 마리너와 아스트라를 위한 여러 가지 예방 조치를 취하고 있지만, 하사비스는 추가 연구가 필요하다고 밝혔다. 그는 “실제 환경이 아닌 강화된 샌드박스 환경에서의 테스트와 같은 새로운 안전성 솔루션이 필요할 것”이라며, “에이전트들이 더 유용해지겠지만, 동시에 위험 요소도 증가할 수 있다”고 말했다.

 

Gemini 2.0은 현재 실험 단계지만, Gemini 웹 앱에서 새로운 모델을 선택하면 이미 사용할 수 있다. (Flash 모델 이외의 모델 공개 일정은 아직 발표되지 않았다.) 하사비스는 Gemini 2.0이 내년 초 구글의 다양한 플랫폼과 모든 제품, 나아가 인터넷 전체를 지원할 계획이라고 밝혔다.

 

* 위의 글은 The Verge의 영문 기사를 번역하였습니다. 원문은 아래에서 확인 가능합니다.

https://www.theverge.com/2024/12/11/24318444/google-gemini-2-0-flash-ai-model?utm_source=chatgpt.com


결론: AI 에이전트 시대를 준비하라

Gemini 2.0의 출시는 멀티모달 및 AI 에이전트 시대의 본격적인 출발점입니다. 이 기술의 발전은 우리의 삶과 산업 전반에 커다란 변화를 가져올 것입니다. 앞으로 구글 Gemini 2.0의 활용과 발전을 주목해야 합니다.