Show HN: Gemma Gem – 브라우저에 내장된 AI 모델 – API 키 없이, 클라우드 없이

발행: (2026년 4월 6일 AM 09:14 GMT+9)
3 분 소요

Source: Hacker News

Overview

Gemma Gem은 Chrome 확장 프로그램으로, WebGPU를 통해 오프‑스크린 문서에서 Google의 Gemma 4 (2B) 모델을 로드합니다. 이 확장 프로그램은 페이지의 내용을 읽고, 스크린샷을 찍고, 요소를 클릭하고, 텍스트를 입력하고, 스크롤하며, JavaScript를 실행하는 도구들을 모델에 장착합니다.

모든 페이지에 작은 채팅 오버레이가 표시됩니다. 페이지에 대해 질문하면 모델이 (대부분) 어떤 도구를 사용할지 판단합니다. 또한 작업 중에 연쇄 사고 과정을 표시하는 thinking mode도 제공합니다.

Features

  • 브라우저 내 2 B 모델이 WebGPU를 통해 실행되며, API 키나 클라우드 서비스가 필요 없습니다.
  • 도구 모음: 페이지 내용 읽기, 스크린샷 캡처, 요소 클릭, 텍스트 입력, 스크롤, 임의의 JavaScript 실행.
  • 채팅 오버레이가 모든 페이지에 표시되어 인터랙티브하게 질의할 수 있습니다.
  • Thinking mode는 모델의 추론 단계를 시각화합니다.
  • 외부 의존성 제로; 에이전트 루프를 독립 라이브러리로 추출하여 실험에 활용할 수 있습니다.

Limitations

  • 간단한 페이지 질문 및 단일 단계 JavaScript 실행에 가장 적합합니다.
  • 다단계 도구 체인은 신뢰성이 낮으며, 모델이 도구를 완전히 무시하는 경우도 있습니다.

Comments

Hacker News discussion (id 47655367) – 15 points, 1 comment.

0 조회
Back to Blog

관련 글

더 보기 »