본문 바로가기
카테고리 없음

구글, 젬마 3 AI 모델 공개

by jaywhy502087 2025. 3. 13.
반응형

구글은 단일 GPU 또는 TPU에서 효율적으로 실행되도록 설계된 새로운 AI 모델 제품군인 젬마 3를 공개했습니다. 이 제품은 더 큰 경쟁사 제품보다 성능이 뛰어나며, 인상적인 다국어 및 다중 모드 기능을 제공한다고 주장합니다. 디지털 트렌드에 따르면, 구글은 젬마 3를 세계 최고의 단일 가속기 모델로 설명하면서, 광범위한 계산 자원을 필요로 하지 않고 단일 GPU 또는 TPU에서 실행될 수 있다고 강조합니다.

구글, 젬마 3 AI 모델 공개

컴팩트한 패키지에 인상적인 기능을 제공하는 Gemma 3는 1B에서 27B 파라미터에 이르는 4가지 크기로 제공되므로 개발자가 특정 요구 사항과 하드웨어 제약 조건에 따라 선택할 수 있습니다. 이 모델은 128K 토큰 컨텍스트 창을 자랑하며, 약 30개의 고해상도 이미지, 300페이지 분량의 책 또는 1시간 이상의 비디오를 처리할 수 있습니다. 주요 기능은 다음과 같습니다.

  • 140개 이상의 언어를 지원하는 다국어 지원
  • 이미지, 텍스트, 짧은 비디오를 분석하는 다중 모드 기능
  • 작업 자동화를 위한 내장 함수 호출 및 구조화된 출력
  • 크기와 계산 요구 사항을 줄이기 위한 정량화된 버전
  • 초기 평가에서 Llama-405B 및 OpenAI의 o3-mini와 같은 대형 모델보다 성능이 뛰어남

이러한 기능 덕분에 Gemma 3는 하드웨어 효율성을 유지하면서 복잡한 작업을 처리할 수 있는 다재다능하고 효율적인 AI 솔루션으로 자리매김했습니다.

Gemma 3의 기술적 진보

구글의 주력 모델인 Gemini 2.0을 기반으로 하는 Gemma 3는 싱글 액셀러레이터 성능에 최적화된 고급 기술 기능을 통합합니다. 이 모델은 기존의 로터리 포지션 임베딩(Rope) 기술을 뛰어넘는 정교한 주의 메커니즘을 구현하여 컨텍스트 처리 및 추론 기능을 향상시킵니다. 이러한 최적화를 통해 Gemma 3는 싱글 GPU 또는 TPU에서 효율성을 유지하면서 우수한 성능을 달성할 수 있습니다.

  • Gemini 2.0과 기술적 기반을 공유하지만, 단일 액셀러레이터와 함께 사용하도록 조정됨
  • 기존 Rope 기술을 능가하는 고급 첨부 파일 메커니즘
  • 크기와 계산 요구 사항을 줄이기 위해 정량화된 버전의 공식을 제공함
  • 다양한 하드웨어 구성에서 GPU 성능을 향상시키기 위해 NVIDIA와 협력하여 최적화됨
  • 대량의 텍스트, 이미지, 비디오 콘텐츠를 처리하기 위해 최대 128K 토큰의 컨텍스트 창을 지원함

Gemma 3용 애플리케이션

다용도로 설계된 Gemma 3를 사용하면 개발자가 챗봇, 이미지 분석 도구부터 자동화된 워크플로에 이르기까지 다양한 AI 애플리케이션을 만들 수 있습니다. 이 모델의 효율성은 온디바이스 AI 처리가 필요한 모바일 및 웹 애플리케이션과 멀티모달 기능을 활용하는 AI 강화 검색 환경에 이상적입니다. 개발자들은 성능 최적화를 위해 설계된 Google Colab, Vertex AI, NVIDIA GPU와 같은 플랫폼을 사용하여 Gemma 3를 쉽게 커스터마이즈하고 배포할 수 있습니다. 이 모델은 현재 Google AI Studio, NVIDIA API Catalog를 통해 제공되고 있으며, Hugging Face, Ollama, Kaggle을 통해 다운로드할 수 있습니다.

고급 AI의 대중화

Gemma 3는 고급 AI 기능을 민주화하여 더 많은 개발자와 조직이 강력한 기계 학습을 이용할 수 있도록 하는 데 있어 중요한 진전을 의미합니다. 단일 GPU 또는 TPU에서 효율적으로 실행할 수 있는 모델을 설계함으로써 Google은 AI 개발 진입 장벽을 낮추어 소규모 기업과 개인 개발자가 방대한 컴퓨팅 리소스를 필요로 하지 않고도 최첨단 AI를 활용할 수 있도록 했습니다.

이러한 민주화는 하드웨어 요구 사항의 범위를 넘어 확장됩니다. 구글은 구글 AI 스튜디오, 엔비디아 API 카탈로그, 허깅 페이스, 올라마, 카글 등 여러 플랫폼을 통해 젬마 3를 사용할 수 있도록 했습니다. 이 모델의 오픈 소스 특성과 여러 플랫폼에서의 가용성은 혁신과 실험을 장려하여 의료, 교육, 소규모 비즈니스 자동화 등 다양한 분야에서 새로운 AI 응용 프로그램으로 이어질 수 있습니다.