AI Dev Weekly #14: Claude Fable 5 논란, DiffusionGemma 텍스트 생성 혁신, 애플 시리 재구축

발행: 3일 전 (2026년 6월 11일 PM 10:02 GMT+9)

10 분 소요

Source: Dev.to

AI Dev Weekly는 매주 목요일에 발행되는 시리즈로, 일주일 동안 가장 중요한 AI 개발자 뉴스를 다루며, 이 도구들을 매일 직접 사용하는 사람으로서의 의견을 제공합니다.
이번 주는 제가 뉴스레터를 쓰기 시작한 이후 가장 내용이 풍부한 한 주였습니다. 정상적인 한 주를 차지할 정도인 네 개의 이야기가 72시간 안에 연속으로 등장했는데, 바로 Anthropic이 지금까지 가장 강력한 모델을 출시했고(숨겨진 제한으로 분노를 촉발), Google가 텍스트를 4배 빠르게 생성하는 새로운 방식을 고안했으며, Apple이 Gemini 위에 Siri를 처음부터 다시 만들었고, 독일 법원이 모든 AI 배포 개발자에게 영향을 미치는 판결을 내렸습니다. 바로 시작합니다.

Anthropic – Claude Fable 5

Anthropic은 6월 9일 Claude Fable 5를 공개했습니다—일반 대중에게 제공되는 최초의 Mythos‑class 모델입니다. 벤치마크 결과는 정말 놀랍습니다: SWE‑bench Verified에서 95%, SWE‑bench Pro에서 80%, Every’s Senior Engineer 벤치마크에서 91/100점(대조군인 Opus 4.8은 63점, GPT‑5.5는 62점) 을 기록했습니다.

스펙: 1M 컨텍스트, 최대 128K 출력, 토큰당 $10/$50 (Opus 4.8의 정확히 2배). 6월 22일까지 Pro/Max/Team/Enterprise 플랜에서는 무료로 이용할 수 있습니다.

하지만 모델 카드에 눈을 돌리면…

논란

Fable 5에는 프론티어 LLM 개발(프리트레이닝 파이프라인, 분산 학습 인프라, ML 가속기 설계 등)에 관한 질문을 할 때 그 효율성을 은밀히 제한하는 숨겨진 개입이 포함되어 있습니다. 명시적인 사이버·바이오 안전장치와 달리(이 경우 모델이 Opus 4.8으로 전환하고 이유를 알려줌), 이 개입은 스티어링 벡터와 PEFT를 사용해 Claude가 조용히 덜 도움이 되도록 만들며, 사용자에게는 전혀 알리지 않습니다. “모델이 모른다”와 “모델이 제한되고 있다”를 구분할 방법이 없습니다.

Fortune은 이를 “비밀 파괴”라고 보도했고, Hacker News 스레드는 1,000점 이상을 기록했습니다. 연구자들은 격분하고 있습니다.

내 의견

코딩 측면에서 이 모델은 뛰어납니다. 앱을 만들고, 코드를 작성하고, 시스템을 디버깅한다면 Fable 5가 현재 존재하는 최고의 도구입니다. 하지만 ML 연구를 한다면, 모든 평범한 답변이 진짜 한계인지 아니면 조용히 적용된 정책 개입인지 고민하게 됩니다. 이는 명시적인 거절보다 신뢰를 훨씬 더 부식시킵니다. Claude Code용 안전장치 심층 분석과 설정 가이드를 참고하세요.

Google DeepMind – DiffusionGemma

모두가 Fable 5 논쟁에 휘말려 있을 때, Google DeepMind는 장기적으로 더 큰 영향을 미칠 수 있는 무언가를 조용히 공개했습니다. DiffusionGemma는 토큰을 하나씩 순차적으로 예측하는 전통적인 자동회귀 방식이 아니라, 확산(diffusion) 방식을 사용해 텍스트를 생성하는 오픈소스 모델입니다.

전통적인 방식은 왼쪽에서 오른쪽으로 한 토큰씩 예측하지만, DiffusionGemma는 무작위 자리표시자 토큰 캔버스로 시작해 여러 차례 디노이징(pass) 과정을 통해 전체 토큰을 동시에 반복적으로 다듬어갑니다. 이미지용 Stable Diffusion을 텍스트에 적용한 것이라고 생각하면 됩니다.

결과: 4배 빠른 생성 속도, NVIDIA RTX GPU에서 초당 1,000 토큰 이상. 모델 전체 파라미터는 26 B, 활성 파라미터는 3.8 B(MoE), 18 GB VRAM에 장착 가능, Apache 2.0 라이선스로 배포됩니다.

내 의견

현재는 실험 단계라—복잡한 추론 과제에서는 Fable 5나 GPT‑5.5에 못 미칩니다. 하지만 속도 측면에서의 파급 효과는 엄청납니다. 실시간 챗봇, 음성 에이전트, 게임 NPC, 실시간 코딩 제안 등 지연 시간이 중요한 모든 분야에서 확산 모델이 변혁을 일으킬 수 있습니다. 이 접근법이 성숙한다면 “초당 토큰” 논의 자체가 바뀔 것입니다. 텍스트 확산 작동 원리와 로컬 설정 가이드를 확인해 보세요.

Apple – WWDC 2026 AI 스택 전면 개편

Apple은 WWDC 2026에서 전체 AI 스택을 새롭게 재구성했습니다.

Siri AI — Google Gemini 기술을 기반으로 한 1.2 T 파라미터 모델. 개인 컨텍스트, 화면 인식, 앱 액션 지원. SiriKit은 폐지되고 App Intents가 필수가 됩니다.
Core AI — Apple Silicon 전용 자체 모델을 실행할 수 있는 완전 새로운 프레임워크. 서버 비용 0, 데이터가 디바이스를 떠나지 않음. PyTorch 변환 파이프라인, 양자화 툴킷, Xcode 디버거 제공.
Xcode 27 — Claude, Gemini, GPT 에이전트를 IDE에 직접 통합. MCP 지원, Agent Client Protocol, Device Hub 포함. Apple silicon 전용, 크기 30 % 감소.
Foundation Models — 다운로드 수가 2 M 미만인 앱에 대해 무료 프라이빗 클라우드 컴퓨팅 제공. 온‑디바이스, 클라우드, 서드파티 모델을 하나의 Swift API와 새로운 Language Model Protocol으로 연결.

내 의견

소규모 개발자를 위한 무료 클라우드 AI가 가장 눈에 띄는 이야기입니다. iOS 앱을 만드는 인디 개발자라면 이제 비용 없이 GPT 수준의 지능을 활용할 수 있습니다. 이 모든 것이 Apple × Google 파트너십(연간 1 B 달러) 덕분이며, Apple은 Gemini‑class 모델을 직접 배포하기보다 자체 학습을 통해 모델을 “자신의 것”으로 만들고 있어 프라이버시 포지셔닝에 매우 영리합니다.

독일 법원 판결 – Landgericht München

2024 년 5 월 28 일, 뮌헨 지방법원은 Google의 AI Overviews가 제3자 검색 결과가 아닌 Google 자체 콘텐츠임을 판결했습니다. 주요 내용 세 가지:

AI‑생성 요약은 운영자의 자체 진술로 간주(단순 인덱싱이 아님)
“사용자가 스스로 사실 확인할 수 있다”는 방어는 인정되지 않음
DSA(디지털 서비스 법) 플랫폼 보호는 AI‑생성 콘텐츠에 적용되지 않음

이 판결은 사용자에게 보여지는 AI‑생성 콘텐츠를 배포하는 모든 개발자에게 영향을 미칩니다. ChatGPT, Claude, Perplexity 등 모두 동일한 논리가 적용됩니다. AI가 명예훼손성 내용을 생성하면, 플랫폼이 아닌 작성자로서 책임을 질 수 있습니다.

내 의견

아직 하지 않았다면 AI 출력 로그를 남기고 콘텐츠 모더레이션을 구현하세요. EU 제품 책임 지침은 AI를 명시적으로 포함하고 있으며, 2026 년 12 월까지 전환 기한이 있습니다. 전체 법률 분석을 확인하세요.

Cohere – North Mini Code

Cohere는 Apache 2.0 라이선스로 배포되는 30 B/3 B‑active MoE 모델인 North Mini Code를 출시했습니다. 에이전시 코딩에 특화된 이 모델은 Artificial Analysis Coding Index에서

AI Dev Weekly #14: Claude Fable 5 논란, DiffusionGemma 텍스트 생성 혁신, 애플 시리 재구축

Anthropic – Claude Fable 5

논란

내 의견

Google DeepMind – DiffusionGemma

내 의견

Apple – WWDC 2026 AI 스택 전면 개편

내 의견

독일 법원 판결 – Landgericht München

내 의견

Cohere – North Mini Code

관련 글

자체 호스팅 LLM 에이전트 군단 신뢰성 확보

인지적 부채: AI가 만든 코드의 숨은 비용

README가 거짓말을 하니, 병합할 때마다/docs PR를 여는 봇을 만들었다.

RTO vs RPO vs MTTR vs MTBF: the Security+ metrics people mix up, and how to keep them straight

Anthropic – Claude Fable 5

논란

내 의견

Google DeepMind – DiffusionGemma

내 의견

Apple – WWDC 2026 AI 스택 전면 개편

내 의견

독일 법원 판결 – Landgericht München

내 의견

Cohere – North Mini Code

관련 글

자체 호스팅 LLM 에이전트 군단 신뢰성 확보

인지적 부채: AI가 만든 코드의 숨은 비용

README가 거짓말을 하니, 병합할 때마다/docs PR를 여는 봇을 만들었다.

RTO vs RPO vs MTTR vs MTBF: the Security+ metrics people mix up, and how to keep them straight

Anthropic – Claude Fable 5

Apple – WWDC 2026 AI 스택 전면 개편

Cohere – North Mini Code