Claude Code 데일리 브리핑 - 2026-06-06
최신 릴리스 요약
| 버전 | 날짜 | 핵심 변경 |
|---|---|---|
| v2.1.166 | 6/6 | fallbackModel(최대 3개 폴백 모델)·--fallback-model 인터랙티브 적용, deny 규칙 glob 지원("*"=전 도구 차단), 크로스세션 SendMessage 권한 하드닝, thinking 비활성화 제어, 폴백 자동 1회 재시도, 다수 수정 |
| v2.1.165 | 6/5 | 버그 수정·안정성 개선 |
| v2.1.163 | 6/4 | requiredMinimumVersion/requiredMaximumVersion, /plugin list, Stop·SubagentStop 훅 additionalContext (어제 다룸) |
오늘(6/6) v2.1.166이 나왔습니다. 어제(6/5) v2.1.165는 “버그 수정·안정성 개선”만 담은 조용한 릴리스였지만, v2.1.166은 모델 폴백·권한 deny glob·크로스세션 메시지 보안이라는 실속 있는 변화를 한꺼번에 담았습니다.
주요 신규 기능 & 실전 활용
주 모델이 죽어도 멈추지 않게 — fallbackModel / --fallback-model (v2.1.166)
v2.1.166에 폴백 모델을 최대 3개까지 순서대로 지정하는 fallbackModel 설정이 추가됐습니다. 주 모델이 과부하(overloaded)이거나 사용 불가일 때, 지정한 순서대로 다음 모델로 넘어갑니다. 기존 --fallback-model 플래그는 헤드리스에만 적용됐는데, 이제 인터랙티브 세션에도 적용됩니다. 더해서 API가 예기치 못한(재시도 불가로 분류되던) 오류를 돌려줄 때 폴백 모델로 턴을 한 번 자동 재시도합니다 — 단, 인증·레이트리밋·요청 크기·전송 오류는 종전대로 즉시 표면화됩니다.
# 주 모델이 과부하면 Sonnet으로 폴백 (인터랙티브 세션에도 적용)
claude --fallback-model claude-sonnet-4-6
설정 파일에서는 fallbackModel 키로 최대 3개 모델을 순서대로 지정할 수 있습니다(정확한 스키마는 곧 갱신될 공식 settings 문서를 따르세요). 6/2~6/5에 다중 모델 오류 인시던트가 연이어 있었던 만큼, 모델 가용성에 의존하는 무인 파이프라인·CI에서 “한 모델이 흔들려도 작업이 죽지 않게” 하는 가용성 가드로 유용합니다.
deny 규칙에 glob — "*" 한 줄로 전 도구 차단 (v2.1.166)
v2.1.166부터 권한 deny 규칙의 도구 이름 위치에 glob 패턴을 쓸 수 있습니다. "*"는 모든 도구를 차단합니다. 반대로 allow 규칙에서는 비-MCP glob을 거부하고(오버허용 방지), deny 규칙에 알 수 없는 도구 이름이 있으면 시작 시 경고합니다.
// .claude/settings.json — 기본 전면 차단 후 필요한 것만 허용하는 "deny-by-default" 골격
{
"permissions": {
"deny": ["*"],
"allow": ["Read", "Grep", "Glob"]
}
}
엄격한 샌드박스나 읽기 전용 탐색 에이전트를 만들 때, 도구를 하나씩 막는 대신 "*"로 전부 잠그고 필요한 것만 여는 화이트리스트 방식을 한 줄로 표현할 수 있습니다. (정확한 우선순위·조합 규칙은 공식 permissions 문서를 확인하세요.)
개발자 워크플로우 팁
Anthropic이 직접 공개한 “스킬 잘 쓰는 법” — 9개 카테고리와 Gotchas 섹션
Anthropic의 Claude Code 팀이 사내에서 수백 개의 스킬을 실제로 운용하며 얻은 교훈을 공식 블로그로 공개했습니다(Thariq Shihipar, 6/3). 핵심만 추리면:
- 스킬은 “마크다운 파일”이 아니라 폴더입니다 — 스크립트·자산·데이터를 함께 담을 수 있습니다.
- 사내 스킬을 분류해 보니 9개 카테고리로 수렴했습니다: 라이브러리/API 레퍼런스, 제품 검증, 데이터 수집/분석, 비즈니스 프로세스/팀 자동화, 코드 스캐폴딩/템플릿, 코드 품질/리뷰, CI/CD·배포, 런북(runbook), 인프라 운영.
- 하나의 스킬은 하나의 카테고리에: 잘 만든 스킬은 한 카테고리에 깔끔히 들어맞고, 여러 개를 욕심내면 에이전트를 혼란시킵니다.
- 가장 값진 콘텐츠는 “Gotchas” 섹션입니다 — Claude가 그 스킬을 쓰며 반복적으로 빠지는 함정을 모아 두고, 엣지 케이스를 발견할 때마다 갱신하세요.
- 지식형 스킬은 뻔한 걸 적지 말 것: 모델이 이미 아는 걸 되풀이하지 말고, Claude를 평소 사고 패턴 밖으로 밀어내는 정보에 집중하세요.
- 점진적 공개(progressive disclosure): 모든 걸 미리 욱여넣지 말고, 상황별 참조 파일을 가리켜 필요할 때 읽게 하세요.
마켓플레이스도 중앙 위원회가 정하지 않고, GitHub 샌드박스 폴더에 올린 뒤 유용성이 입증되면 PR로 승격하는 유기적 방식이라고 합니다.
Anthropic — Lessons from building Claude Code: How we use skills
대량·기계적 작업엔 thinking을 꺼서 비용·지연을 줄이기 — MAX_THINKING_TOKENS=0 (v2.1.166)
v2.1.166부터 MAX_THINKING_TOKENS=0, --thinking disabled, 그리고 모델별 thinking 토글이 기본적으로 사고(thinking)하는 모델의 사고를 실제로 끕니다(Claude API 경유 기준, 서드파티 프로바이더는 변동 없음). 추론이 거의 필요 없는 대량의 기계적 패스(정형 변환, 단순 치환, 포매팅 정리 같은 서브에이전트 작업)에서는 사고 토큰이 비용·지연만 키우기 쉬운데, 이때 thinking을 꺼서 회당 비용과 응답 시간을 줄일 수 있습니다.
# 이 세션에서 thinking 비활성화 (기본 사고 모델도 사고하지 않음)
export MAX_THINKING_TOKENS=0
claude
반대로 아키텍처 판단·난도 높은 디버깅처럼 추론이 결과를 좌우하는 작업에서는 thinking을 켜 둬야 합니다. “어디에 추론 예산을 쓸지”를 작업 성격에 맞춰 가르는 것이 6/15 Programmatic Usage Credits 시행을 앞둔 비용 거버넌스의 한 축입니다.
보안/제한 이슈
6월 5일 — 다수 Claude 모델 오류 인시던트 (6/5)
6월 5일, Anthropic 상태 페이지에 여러 Claude 모델에서 오류율이 상승한 인시던트가 기록됐습니다. 08:08 PT(15:08 UTC)경 시작해 모델별로 복구 시점이 갈렸는데, Opus 4.6이 가장 먼저(08:25 PT), Opus 4.5가 가장 늦게(10:29 PT) 회복됐고 이후 모든 모델이 완전 복구됐습니다. 6/2 대규모 장애·6/3 인시던트에 이어 모델 가용성이 며칠째 출렁인 셈으로, 바로 위에서 소개한 fallbackModel로 주 모델 흔들림에 대비해 둘 실용적 동기가 됩니다.
v2.1.166 — 크로스세션 메시지가 더 이상 사용자 권한을 갖지 않음 (6/6)
v2.1.166에 세션 간 메시지 전달(cross-session messaging) 하드닝이 들어왔습니다. 다른 Claude 세션에서 SendMessage로 중계된 메시지는 더 이상 사용자 권한(user authority)을 갖지 않습니다 — 수신 측은 중계된 권한 요청을 거부하고, auto 모드는 이를 차단합니다. 한 세션이 다른 세션을 도구처럼 조종해 권한을 우회하던 경로를 막는 변경입니다. 함께 들어온 권한 관련 수정도 점검할 가치가 있습니다.
- 잘못된 항목 하나가 나머지 정책까지 무력화하던 문제 수정: managed settings에 유효하지 않은 항목이 하나 있으면, 그 파일의 나머지 유효한 정책 집행까지 조용히 비활성화되던 문제가 고쳐졌습니다.
${VAR}사용 시 MCP 서버 정책 미매칭 수정: managed-settings의allowedMcpServers/deniedMcpServers가${VAR}참조를 쓰면 매칭되지 않던 문제가 수정됐습니다.
커뮤니티 뉴스
-
“AI-네이티브 엔지니어링 조직 운영” — Claude Code 팀은 어떻게 일하나 (6/3): Claude Code·Cowork 엔지니어링 디렉터 Fiona Fung이 에이전틱 코딩이 기본값이 된 뒤 팀의 프로세스·구조가 어떻게 바뀌었는지 공유했습니다. 6개월 로드맵이 3개월이면 낡아버려 장기 계획 대신 “적시(just-in-time)” 계획으로 옮겼고, 빠르게 프로토타이핑해 내부 사용자를 일찍 끌어들여 피드백으로 반복합니다. 코드 리뷰는 스타일·린트·버그 탐지를 Claude가 맡고, 사람은 도메인·보안 민감 코드·제품 판단에 집중합니다. 매니저는 IC(개별 기여자)로 시작해 엔지니어 경험을 직접 겪게 하고, PM이 프로토타입 코드를 짜는 등 역할 경계가 흐려졌습니다. claude.com 블로그
-
터미널을 한 번도 안 열어본 영업사원이 만든 Gmail 자동응답 앱 ‘CLAFTS’ (6/5): Anthropic GTM PM Jared Sires는 입사 전 터미널을 써본 적이 없었지만, 약 4,300줄(거의 전부 Claude Code가 작성) 의 Gmail 내장 앱 CLAFTS(Claude Drafts) 를 만들었습니다. 계정이 600
700개로 불어나 밤 910시까지 고객 메일에 답하던 문제를, Google Drive·서드파티 도구에서 맥락을 끌어오고 공개 문서를 웹 검색으로 참조하며 본인 문체를 흉내 내 초안을 미리 작성하는 앱으로 해결했습니다. 이제 그는 이런 도구들을 Claude Cowork 플러그인으로 패키징해 영업팀 전체가 쓰게 합니다. 비개발자도 에이전틱 코딩으로 사내 도구를 만드는 흐름을 보여주는 사례입니다. claude.com 블로그
알아두면 좋은 소소한 변경사항
claude update가 대상 버전을 먼저 알림: 조용히 받던 대신, 다운로드 전에 어떤 버전으로 갈지 표시합니다 (v2.1.166)claude agentsURL 필터: 목록에 URL을 입력하면 첫 프롬프트에 그 URL이 들어 있던 세션으로 좁혀집니다 (v2.1.166)- “image could not be processed” 반복 오류 수정: 처리 불가 이미지를 보냈을 때 반복되던 오류와 추가 토큰 소비가 함께 고쳐졌습니다 (v2.1.166)
- JetBrains 터미널 깜빡임 수정: IntelliJ·PyCharm·WebStorm 등 2026.1+에서 synchronized output을 켜 깜빡임을 없앴습니다 (v2.1.166)
- Kitty 키보드 프로토콜 Shift+비ASCII 수정: WezTerm·Ghostty·kitty에서 Shift+ä→Ä 같은 입력이 누락되던 문제가 고쳐졌습니다 (v2.1.166)
- 워크트리 백그라운드 에이전트 크래시 루프 수정: git worktree에 진입한 백그라운드 에이전트 세션을
claude agents에서 다시 열면 “No conversation found”로 무한 크래시하던 문제가 수정됐습니다 (v2.1.166)
추천 칼럼 & 읽을거리
-
“AI-네이티브 스타트업을 만드는 방법”: 경쟁우위는 더 좋은 모델이 아니라 규율(discipline) 에서 나온다는 6단계 프레임워크입니다. 워크플로우를 체계적으로 지도화하고, 컨텍스트 시스템을 구축하고, 평가(eval)와 함께 스킬을 코드화하며, 주간 개선 루프를 돌리면 작은 팀이 전통적 조직보다 기하급수적으로 빠르게 학습한다고 봅니다. “스킬을 코드화하라”는 위의 Anthropic 스킬 글과 정확히 같은 결의 실천론입니다. GN+ 22포인트. GeekNews
-
“AI가 스스로를 만들 때: 재귀적 자기 개선을 향한 우리의 진전” — Anthropic: Claude의 작업 완수 가능 시간(task horizon)이 4개월마다 두 배가 되고 있으며, 이 추세와 충분한 연산이 맞물리면 AI가 후속 모델을 스스로 설계·구축할 수도 있다는 분석입니다. 다만 “어떤 문제가 가장 중요한가”라는 연구 판단은 여전히 인간의 비교우위로 남고, 의미 있는 안전장치에는 여러 프런티어 랩 간 검증 가능한 국제 협력이 필요하다고 짚습니다. 에이전트에 점점 더 많은 걸 맡기는 우리가 그 궤적을 어떻게 봐야 하는지 되묻는 글입니다. GN+ 15포인트·댓글 2. GeekNews
-
“Claude가 rsync의 버그를 늘렸는가?”: Claude의 도움을 받은 rsync 릴리스(v3.4.2·v3.4.3)가 과거 릴리스보다 정말 버그가 많았는지 데이터로 검증한 글입니다. 커밋 10개당 심각도 가중 버그 수를 지표로, 순열검정·Fisher 정확검정에서 p값 46%·74% — “Claude 릴리스가 비정상적으로 버그가 많다는 통계적 증거는 없다” 는 결론을 냅니다. 오히려 Claude 이전인 v3.4.1이 데이터셋 전체에서 가장 버그가 많았습니다. AI 코딩에 대한 인상 비판을 숫자로 반박하는, 차분한 분석입니다. GeekNews
흥미로운 프로젝트 & 도구
-
harness-starter-kit — 코딩 에이전트가 같은 실수를 반복하지 않게 하는 레포 하네스:
AGENTS.md·결정 로그(decision log)·실패 추적 파일로 프로젝트 규칙과 결정 이력을 레포 안에 영속시켜, 에이전트가 세션을 넘나들며 과거 맥락을 참조하게 하는 오픈소스 스타터킷입니다. Django·Next.js·FastAPI용 워크플로우 스크립트와 프로파일 예시를 제공합니다. 규칙을 “강제 집행”하던 oh-my-harness와 달리, 이쪽은 결정·실패의 기억을 누적하는 데 방점이 있습니다. GN+ Show. GeekNews -
에이전트 메모리 아키텍처 플러그인 — 메모리 노이즈·decay 문제 해결: 에이전트를 “프롬프트”가 아니라 실제 파일을 가진 레포로 구조화하고, 큐레이터(curator)가 감독하는 티켓 기반 메모리로 노이즈와 기억 소실(decay)을 다루는 오픈소스 플러그인(Apache 2.0)입니다. Claude·Codex·Gemini 런타임 간 벤더 락인 없이 이식되며, 자기진화 단일 에이전트·오케스트레이션 멀티에이전트·기존 워크스페이스 재패키징의 세 가지 모드를 제공합니다. 장기 세션의 “기억” 문제를 정면으로 겨냥한 시도입니다. GN+ Show. GeekNews