Claude Code デイリーブリーフィング - 2026-06-06
最新リリース概要
| バージョン | 日付 | 主な変更 |
|---|---|---|
| v2.1.166 | 6/6 | fallbackModel(最大3つを順番に)・--fallback-model がインタラクティブにも適用、deny ルールで glob 対応("*"=全ツール拒否)、クロスセッション SendMessage 権限ハードニング、thinking 無効化制御、フォールバックで1回自動リトライ、多数の修正 |
| v2.1.165 | 6/5 | バグ修正・信頼性の改善 |
| v2.1.163 | 6/4 | requiredMinimumVersion/requiredMaximumVersion、/plugin list、Stop・SubagentStop フックの additionalContext(昨日紹介済み) |
本日(6/6)v2.1.166 がリリースされました。昨日(6/5)の v2.1.165 は「バグ修正・信頼性の改善」のみの静かなリリースでしたが、v2.1.166 はモデルのフォールバック・deny ルールの glob・クロスセッションメッセージのセキュリティという中身のある変更をまとめて含んでいます。
主要な新機能と実践活用
メインモデルが落ちても止まらない — fallbackModel / --fallback-model(v2.1.166)
v2.1.166 に、フォールバックモデルを最大3つまで順番に指定できる fallbackModel 設定が追加されました。メインモデルが過負荷(overloaded)または利用不可のとき、指定した順にフォールバックします。これまでヘッドレス専用だった --fallback-model フラグが、インタラクティブセッションにも適用されるようになりました。さらに、API が(従来はリトライ不可と扱われていた)予期しないエラーを返した場合に、フォールバックモデルでターンを1回自動リトライします — ただし認証・レート制限・リクエストサイズ・トランスポートのエラーは従来どおり即座に表面化します。
# メインモデルが過負荷なら Sonnet にフォールバック(インタラクティブセッションにも適用)
claude --fallback-model claude-sonnet-4-6
設定ファイルでは fallbackModel キーで最大3モデルを順番に指定できます(正確なスキーマは、今後更新される公式 settings ドキュメントに従ってください)。6/2〜6/5 に複数モデルのエラーインシデントが続いたことを踏まえると、モデルの可用性に依存する無人パイプラインや CI で**「1つのモデルが揺らいでもジョブが死なない」**ための可用性ガードとして有用です。
deny ルールに glob — "*" 一行で全ツールを拒否(v2.1.166)
v2.1.166 から、権限 deny ルールのツール名の位置に glob パターンを使えます。"*" はすべてのツールを拒否します。逆に allow ルールでは非 MCP の glob を拒否し(過剰な許可を防止)、deny ルールに未知のツール名があると起動時に警告します。
// .claude/settings.json — まず全拒否し、必要なものだけ許可する "deny-by-default" の骨組み
{
"permissions": {
"deny": ["*"],
"allow": ["Read", "Grep", "Glob"]
}
}
厳格なサンドボックスや読み取り専用の探索エージェントを作るとき、ツールを1つずつ拒否する代わりに、"*" ですべてロックし、必要なものだけ開けるホワイトリスト方式を一行で表現できます。(正確な優先順位や組み合わせのルールは公式 permissions ドキュメントを確認してください。)
開発者ワークフローティップス
Anthropic が自ら公開した「スキルの上手な使い方」 — 9つのカテゴリと Gotchas セクション
Anthropic の Claude Code チームが、社内で数百のスキルを実際に運用して得た教訓を公式ブログで公開しました(Thariq Shihipar、6/3)。要点は次のとおりです。
- スキルは「マークダウンファイル」ではなくフォルダです — スクリプト・アセット・データを同梱できます。
- 社内スキルを分類したところ、9つのカテゴリに収束しました。ライブラリ/API リファレンス、製品検証、データ取得/分析、ビジネスプロセス/チーム自動化、コードのスキャフォールディング/テンプレート、コード品質/レビュー、CI/CD・デプロイ、ランブック(runbook)、インフラ運用です。
- 1つのスキルは1つのカテゴリに。 良いスキルは1つのカテゴリにきれいに収まり、欲張ったものは複数にまたがってエージェントを混乱させます。
- 最も価値ある内容は「Gotchas」セクションです。Claude がそのスキルを使うときに繰り返しはまる落とし穴を集め、エッジケースを見つけるたびに更新しましょう。
- 知識系スキルは当たり前のことを書かない。 モデルがすでに知っていることを繰り返さず、Claude を普段の思考パターンの外へ押し出す情報に集中します。
- 段階的開示(progressive disclosure)。 すべてを前もって詰め込まず、状況別の参照ファイルを指し示して必要なときに読ませます。
マーケットプレイスも中央委員会が決めるのではなく、GitHub のサンドボックスフォルダに上げ、有用性が実証されたら PR で昇格する有機的な方式だそうです。
Anthropic — Lessons from building Claude Code: How we use skills
大量・機械的な作業では thinking をオフにしてコストとレイテンシを削減 — MAX_THINKING_TOKENS=0(v2.1.166)
v2.1.166 から、MAX_THINKING_TOKENS=0、--thinking disabled、およびモデルごとの thinking トグルが、デフォルトで思考(thinking)するモデルの思考を実際にオフにします(Claude API 経由が対象、サードパーティプロバイダは変更なし)。推論をほとんど必要としない大量の機械的なパス(定型変換、単純な置換、フォーマット整理などのサブエージェント作業)では、思考トークンがコストとレイテンシだけを増やしがちです。そこで thinking をオフにすると、1回あたりのコストと応答時間を削減できます。
# このセッションで thinking を無効化(デフォルトで思考するモデルも思考しない)
export MAX_THINKING_TOKENS=0
claude
逆に、アーキテクチャの判断や難度の高いデバッグなど、推論が結果を左右する作業では thinking をオンにしておくべきです。「どこに推論の予算を使うか」を作業の性質に応じて切り分けることは、6/15 の Programmatic Usage Credits 開始を前にしたコストガバナンスの一軸です。
セキュリティ・制限事項
6月5日 — 複数の Claude モデルでエラーが増加するインシデント(6/5)
6月5日、Anthropic のステータスページに、複数の Claude モデルでエラー率が上昇したインシデントが記録されました。08:08 PT(15:08 UTC)頃に開始し、復旧時刻はモデルごとに分かれ、Opus 4.6 が最も早く(08:25 PT)、Opus 4.5 が最も遅く(10:29 PT)回復した後、すべてのモデルが完全復旧しました。6/2 の大規模障害・6/3 のインシデントに続き、モデルの可用性が数日にわたって不安定だったことになり、上で紹介した fallbackModel でメインモデルの揺らぎに備えておく実践的な動機になります。
v2.1.166 — 中継されたクロスセッションメッセージがユーザー権限を持たなくなった(6/6)
v2.1.166 で、セッション間メッセージ中継(cross-session messaging)のハードニングが入りました。他の Claude セッションから SendMessage で中継されたメッセージは、もはやユーザー権限(user authority)を持ちません — 受信側は中継された権限要求を拒否し、auto モードはこれをブロックします。あるセッションが別のセッションをツールのように操って権限を回避する経路を塞ぐ変更です。あわせて入った権限関連の修正も点検する価値があります。
- 不正な項目が1つあると残りのポリシーまで無効化されていた問題を修正:managed settings に無効な項目が1つあると、そのファイルの残りの有効なポリシーの適用まで静かに無効化されていた問題が修正されました。
${VAR}使用時に MCP サーバーのポリシーがマッチしない問題を修正:managed-settings のallowedMcpServers/deniedMcpServersが${VAR}参照を使うとマッチしなかった問題が修正されました。
コミュニティニュース
-
「AI ネイティブなエンジニアリング組織の運営」 — Claude Code チームはどう働くか(6/3):Claude Code・Cowork のエンジニアリングディレクター Fiona Fung が、エージェンティックコーディングがデフォルトになった後、チームのプロセスと構造がどう変わったかを共有しました。6か月のロードマップが3か月で陳腐化するため、長期計画から「ジャストインタイム」計画へ移行し、素早くプロトタイプし、社内ユーザーを早めに巻き込み、フィードバックで反復します。コードレビューはスタイル・lint・バグ検出を Claude が担い、人間はドメイン知識・セキュリティ機微なコード・プロダクト判断に集中します。マネージャーは IC(個人貢献者)として始めてエンジニア体験を直接味わい、PM がプロトタイプのコードを書くなど役割の境界も曖昧になりました。claude.com ブログ
-
ターミナル未経験の営業が作った Gmail 自動下書きアプリ「CLAFTS」(6/5):Anthropic の GTM PM Jared Sires は入社前にターミナルを使ったことがありませんでしたが、約4,300行(ほぼすべて Claude Code が記述) の Gmail 組み込みアプリ CLAFTS(Claude Drafts) を作りました。担当アカウントが600〜700件に膨らみ、夜9〜10時まで顧客メールに返信していた問題を、Google Drive やサードパーティツールから文脈を取り込み、公開ドキュメントをウェブ検索で参照し、自分の文体を真似て下書きを先に作成するアプリで解決しました。今では、こうしたツールを Claude Cowork のプラグインとしてパッケージ化し、営業チーム全体が使えるようにしています。非エンジニアがエージェンティックコーディングで社内ツールを作る流れを示す好例です。claude.com ブログ
知っておくと便利な小さな変更点
claude updateがターゲットバージョンを先に通知:静かにダウンロードする代わりに、どのバージョンに上げるかを表示します(v2.1.166)claude agentsの URL フィルタ:リストに URL を入力すると、最初のプロンプトにその URL が含まれていたセッションに絞り込みます(v2.1.166)- 「image could not be processed」の繰り返しエラーを修正:処理できない画像を送ったときに繰り返されていたエラーと、余分なトークン消費がともに修正されました(v2.1.166)
- JetBrains ターミナルのちらつきを修正:IntelliJ・PyCharm・WebStorm など 2026.1+ で synchronized output を有効化してちらつきをなくしました(v2.1.166)
- Kitty キーボードプロトコルの Shift+非 ASCII を修正:WezTerm・Ghostty・kitty で Shift+ä→Ä のような入力が欠落していた問題が修正されました(v2.1.166)
- ワークツリーのバックグラウンドエージェントのクラッシュループを修正:git worktree に入ったバックグラウンドエージェントのセッションを
claude agentsから再び開くと「No conversation found」で無限クラッシュしていた問題が修正されました(v2.1.166)
おすすめコラム&読み物
-
「AI ネイティブなスタートアップの作り方」:競争優位は、より良いモデルではなく規律(discipline) から生まれるという6ステップのフレームワークです。ワークフローを体系的にマッピングし、コンテキストシステムを構築し、評価(eval)とともにスキルをコード化し、週次の改善ループを回せば、小さなチームが従来型の組織より指数関数的に速く学習する、と説きます。「スキルをコード化せよ」という点で、上の Anthropic のスキル記事とまったく同じ筋の実践論です。cyberfund(X)
-
「AI が自らを作るとき:再帰的自己改善に向けた我々の進捗」 — Anthropic:Claude のタスク完遂可能な時間(task horizon)が約4か月ごとに2倍になっており、この傾向と十分な計算資源が組み合わされば、AI がいずれ後継モデルを自ら設計・構築する可能性がある、という分析です。ただし「どの問題が最も重要か」という研究上の判断は依然として人間の比較優位に残り、意味のある安全策には複数のフロンティアラボ間の検証可能な国際協調が必要だと指摘します。エージェントにますます多くを委ねる我々が、その軌跡をどう捉えるべきかを問い直す一篇です。Anthropic
-
「Claude は rsync のバグを増やしたか?」:Claude の支援を受けた rsync のリリース(v3.4.2・v3.4.3)が、過去のリリースより本当にバグが多かったのかをデータで検証した記事です。コミット10件あたりの重大度加重バグ数を指標に、順列検定・Fisher の正確確率検定で p 値 46%・74% — 「Claude のリリースが異常にバグが多いという統計的証拠はない」 と結論づけます。むしろ Claude 以前の v3.4.1 がデータセット全体で最もバグが多いものでした。AI コーディングへの印象論的な批判を数字で反論する、落ち着いた分析です。alexispurslane.github.io
注目プロジェクト&ツール
-
harness-starter-kit — コーディングエージェントが同じ失敗を繰り返さないためのレポ「ハーネス」:
AGENTS.md・決定ログ(decision log)・失敗追跡ファイルで、プロジェクトのルールと決定履歴をレポ内に永続化し、エージェントがセッションをまたいで過去の文脈を参照できるようにするオープンソースのスターターキットです。Django・Next.js・FastAPI 向けのワークフロースクリプトとプロファイル例を提供します。ルールを「強制」していた oh-my-harness とは異なり、こちらは決定と失敗の記憶を蓄積する点に重きがあります。GitHub -
エージェントメモリアーキテクチャプラグイン — メモリのノイズと decay 問題に対処:エージェントを「プロンプト」ではなく実際のファイルを持つレポとして構造化し、キュレーター(curator)が監督するチケットベースのメモリでノイズと記憶の減衰(decay)に対処するオープンソースプラグイン(Apache 2.0)です。Claude・Codex・Gemini のランタイム間でベンダーロックインなしに移植でき、自己進化する単一エージェント、検証層を備えたオーケストレーション型マルチエージェント、既存ワークスペースの再パッケージ化という3つのモードを提供します。長時間セッションの「記憶」問題に正面から取り組む試みです。GitHub