Meta의 새로운 모델에 16가지 도구가 있습니다. 이 도구들은 무엇을 하나요?
Source: Dev.to
개요
Meta가 Muse Spark를 출시했습니다. 이는 Llama 4 이후 처음 선보이는 새로운 모델로, 이전 출시 후 약 1년 만에 등장했습니다. 벤치마크에서는 GPT‑5.4, Gemini 3.1 Pro, Opus 4.6과 어깨를 나란히 합니다. 하지만 진정한 새로움은 모델이 직접 호출할 수 있는 16개의 내장 도구에 있습니다—별도의 탈옥이나 외부 플러그인이 필요 없습니다.
도구 카탈로그
Meta는 전체 도구 카탈로그를 공개했습니다(Simon Willison이 추출). 이 도구들은 채팅 환경에 내장되어 있어 Muse Spark에 풍부한 에이전트 개발 환경을 제공합니다.
Python 실행
- container.python_execution –
pandas,numpy,matplotlib,scikit‑learn,opencv,Pillow가 포함된 Python 3.9 샌드박스를 실행합니다. - 파일은
/mnt/data/에 지속됩니다.
핵심 기능:
media.image_gen으로 이미지를 생성한 뒤 같은 컨테이너에서 OpenCV로 즉시 분석할 수 있습니다(예: 라쿤을 생성하고 수염을 세기).
시각적 그라운딩
- container.visual_grounding – 이미지 경로와 객체 이름 리스트를 받아 경계 상자, 점 좌표, 혹은 개수를 반환합니다.
- 별도의 API 호출이나 컨텍스트 전환 없이 채팅 안에서 Segment Anything을 구현합니다.
[
{"object_name": "raccoon whisker", "count": 12},
{"object_name": "raccoon paw claw", "count": 8},
{"object_name": "trash item on head", "count": 3}
]
서브‑에이전트
- subagents.spawn_agent – Muse Spark가 연구나 분석을 독립적인 서브‑에이전트에게 위임할 수 있게 합니다.
- Claude Code에서 사용되는 “서브‑에이전트‑툴” 패턴을 소비자 채팅 인터페이스에서 일급 기능으로 제공한다는 점이 특징입니다.
콘텐츠 검색 (Meta‑1P)
-
meta_1p.content_search – 사용자가 접근 권한을 가진 Instagram, Threads, Facebook 게시물에 대한 의미 검색을 수행합니다.
- 필터: 작성자 ID, 유명인 언급, 댓글, 좋아요, 날짜 범위(예: 2025‑01‑01 이후 게시물).
-
meta_1p.meta_catalog_search – Meta 제품 카탈로그를 검색합니다.
타사 계정 연동
- third_party.link_third_party_account – 다음 서비스와의 연동을 시작합니다:
- Google Calendar
- Outlook Calendar
- Gmail
- Outlook
“당신의 삶을 관리하는 AI 비서”를 위한 기반을 제공합니다.
브라우저 도구
- browser.search – 웹 검색.
- browser.open – 전체 페이지 로드.
- browser.find – 페이지 내 패턴 매치.
미디어 생성
- media.image_gen – 예술적이거나 사실적인 이미지를 생성합니다.
컨테이너 유틸리티
- container.create_web_artifact – HTML/SVG를 렌더링합니다.
- container.download_meta_1p_media – Meta 콘텐츠를 샌드박스로 가져옵니다.
- container.file_search – 업로드된 파일을 검색합니다.
- container.view, container.insert, container.str_replace – 파일을 편집합니다.
함의
Meta는 단순히 모델을 제공하는 것이 아니라, 채팅 인터페이스 뒤에 숨겨진 에이전트 개발 플랫폼을 제공하고 있습니다. 도구 자체가 강력한 방어선 역할을 하는데, 현재 다른 최첨단 모델은 사용자 Instagram, Threads, Facebook 데이터에 대한 네이티브 접근이나 이미지 생성과 컴퓨터 비전 분석의 원활한 통합을 제공하지 못합니다.
Meta는 Muse Spark가 Llama 4 Maverick 수준의 기능을 10배 이상 적은 연산량으로 달성했다고 주장합니다. 만약 정확하다면, 최첨단 추론의 경제성을 노트북 수준 하드웨어로 이동시킬 수 있습니다.
모델은 아직 비공개 프리뷰 단계이지만, Alexandr Wang은 향후 오픈소스 릴리스를 암시했습니다—하지만 이번 버전은 제외됩니다. 도구 카탈로그는 Meta의 장기 전략을 보여줍니다: 순수 모델 제공자에서 자율 에이전트를 위한 플랫폼으로 진화하는 것입니다.
모델은 쉬운 부분이다. 도구가 방어선이다.