Claude Managed Agents「Dreaming」完全ガイド:AIエージェントが自己学習する仕組みと実装方法【2026年5月】
PR: 本記事にはアフィリエイトリンク(プロモーション)が含まれます。掲載するサービスは編集部が記事内容との関連性で選定しており、報酬の有無で評価を変えていません。最終的な料金や条件は必ず各公式サイトの最新情報でご確認ください。
この記事の前提と読み方
- 対象読者: Claude Managed AgentsやAIエージェント開発に興味のある開発者、プロダクトマネージャー、AIオートメーションを業務に活用したいエンジニア
- 想定読了時間: 約20分(概念理解だけなら8分、実装コード込みで20分)
- 前提知識: Claude APIの基本操作、エージェントシステムの概念的理解があると読みやすい。なくても概念は把握できる
- 本文中の情報: 2026年5月時点のAnthropic公式発表・ドキュメントベース。仕様変更の可能性があるため必ず公式ドキュメントで最新情報を確認すること
- アフィリエイト: Coloso・TechGoのリンクが含まれる。利用判断は読者自身の責任で実施すること
はじめに:AIエージェントは「眠っている間」に賢くなる
2026年5月6日、Anthropicは「Code with Claude 2026」カンファレンス(サンフランシスコ・ロンドン・東京の3都市同時開催)で、Claude Managed Agentsに3つの新機能を発表した。
Outcomes(タスク完了の定義)、Multiagent Orchestration(複数エージェントの協調)、そして今回の主役である Dreaming(エージェントの自己学習メカニズム)だ。
このうちDreamingは、名前の通り「エージェントがジョブとジョブの間に過去のセッションを振り返り、自分のパフォーマンスを改善する」という仕組みだ。人間がスポーツや語学の練習後に「この動きはよかった、あの判断は失敗だった」と振り返るプロセスを、AIエージェントに実装したと言える。
法律AIスタートアップのHarveyはDreamingのパイロット参加者として、タスク完了率が約6倍向上したと報告している。この数字が正確かどうかはともかく、エージェントシステムの設計に新しい視点をもたらす機能であることは間違いない。
第1章:Dreamingとは何か
1-1. 概念の整理
Dreamingを一言で説明するなら「スケジュールされた自己レビューと記憶の洗練プロセス」だ。
通常のエージェントは、1つのジョブが終わると次のジョブに向けてリセットされる。ジョブAで得た知見をジョブBに活かすには、開発者が明示的にメモリを実装しなければならなかった。
Dreamingはこの「ジョブ間の空白」を埋める。具体的には以下のサイクルで動作する:
- エージェントがジョブを実行:会話ログ・ツール呼び出し結果・成否メタデータが構造化ログとして保存される
- Dreamingが起動(スケジュール実行):過去セッションのログを読み込み、パターンを抽出する
- メモリの洗練:有効だった手順・繰り返し発生したエラー・ユーザーの修正傾向などをメモリエントリとして更新・追加する
- 次のセッションで活用:洗練されたメモリを持った状態でエージェントが次のジョブを開始する
このサイクルを繰り返すことで、エージェントは「経験を積む」状態になる。
1-2. 既存のMemory機能との違い
Claude Managed Agentsには既存のMemory機能(エージェントが学習内容をメモリストアに書き込む仕組み)がある。DreamingはMemoryを置き換えるものではなく、補完する機能だ。
| 機能 | 動作タイミング | 主な役割 |
|---|---|---|
| Memory | セッション中(エージェント自身が記録) | 個別セッションの学習内容をキャプチャ |
| Dreaming | セッション間(スケジュール実行) | 複数セッションを横断したパターン抽出・メモリ最適化 |
Memoryが「今日の日記」なら、Dreamingは「定期的な日記の見直しと総括」に相当する。
1-3. なぜ「Dreaming」という名前か
人間の脳の記憶定着において、睡眠中に行われる記憶の整理・強化プロセス(記憶の固定化)との類比からきている。睡眠中に海馬から大脳皮質へ記憶が転送・統合されるように、Dreamingはエージェントの稼働停止中に「有用な経験」を長期記憶に変換する。
第2章:技術的な仕組み
2-1. 保存される構造化ログの内容
Dreamingが参照する構造化ログには、通常の会話トランスクリプトだけでなく以下のメタデータが含まれる:
- タスク結果:成功・失敗・部分完了のラベル
- ユーザーによる修正:エージェントの出力に対してユーザーがどう修正したか
- ツール呼び出し履歴:どのツールを呼び出し、それが成功したか失敗したか
- 所要時間:各ステップにかかった時間
- メモリアクセス:どのメモリエントリが参照され、実際に有効だったか
これらのメタデータを組み合わせることで、「この手順を踏むと高確率で成功する」「このエラーパターンが発生したときはこの対処が有効」といったパターンを抽出できる。
2-2. チームへのメモリ共有
Dreamingの重要な特徴の一つがチーム横断的な学習だ。
同一ドメインで動作する20のサブエージェントがある場合、各エージェントのDreamingが個別に動作するだけでなく、集合知をチーム全体のメモリストアに公開できる。
┌─────────────────────────────────────────┐
│ Dreaming の集合知アーキテクチャ │
│ │
│ Agent-1 → 個別メモリ → Dreaming ┐ │
│ Agent-2 → 個別メモリ → Dreaming ├→ チーム共有メモリ │
│ Agent-3 → 個別メモリ → Dreaming ┘ │
│ ↑ 全エージェントが参照可能 │
└─────────────────────────────────────────┘
これにより、1つのエージェントが発見した効率的な手順を、チーム全員が活用できる。大規模マルチエージェントシステムでは特に効果的だ。
2-3. Outcomesとの連携
DreamingはOutcomes(タスク完了条件の定義機能)と組み合わせることで、より精度の高い自己評価が可能になる。
Outcomesで「このタスクが成功とみなされる条件」を明示的に定義しておくことで、Dreamingが「このセッションは成功か否か」を客観的に判定できる。曖昧な成否判定では有用なパターンを抽出しにくいため、DreamingはOutcomesと一緒に使うのが推奨されている。
第3章:利用方法と実装
3-1. アクセス条件
2026年5月時点の状況:
- 利用可能プラン:Pro / Max / Team / Enterprise / Claude API
- ステータス:Research Preview(Outcomes・Multiagent OrchestrationsはPublic Beta)
- 注意:仕様はResearch Previewのため、GAまでに変更される可能性がある
3-2. APIを使った基本実装
以下はClaude Python SDKを使ったDreaming有効化の基本的な実装例だ:
import anthropic
client = anthropic.Anthropic()
# Managed Agentsでエージェントを作成(Dreaming有効化)
agent = client.agents.create(
name="my-dreaming-agent",
model="claude-opus-4-7",
memory_enabled=True, # Memory機能を有効化(Dreaming前提)
dreaming_enabled=True, # Dreaming有効化
dreaming_schedule="after_each_session", # セッション後に実行
)
# Outcomesを定義してタスク完了条件を明示化
outcome = client.agents.outcomes.create(
agent_id=agent.id,
description="ユーザーの技術的な質問に対して、実装可能なコード例を含む回答を提供し、ユーザーが「解決した」「わかった」と確認した状態",
success_criteria=[
"コード例が含まれている",
"エラーハンドリングが考慮されている",
"ユーザーが肯定的なフィードバックを提供した"
]
)
# セッションを開始
session = client.agents.sessions.create(
agent_id=agent.id,
outcome_id=outcome.id
)
3-3. Dreamingの実行スケジュール設定
Dreamingの実行タイミングは用途によって調整できる。
# セッション終了後に即座に実行(リアルタイム学習重視)
dreaming_schedule = "after_each_session"
# バッチ実行(例:1日1回、深夜に実行)
dreaming_schedule = "daily"
# 指定セッション数ごとに実行(トークンコスト管理)
dreaming_schedule = "every_10_sessions"
高頻度ジョブ(例:1日100回以上実行するカスタマーサポートエージェント)ではdailyスケジュールで十分な場合が多い。逆に、精度を重視する専門家向けエージェント(法律・医療分析など)ではafter_each_sessionが効果的だ。
3-4. メモリストアの確認
Dreamingが更新したメモリエントリは以下のように確認できる:
# Dreamingが生成したメモリエントリを取得
memories = client.agents.memory.list(
agent_id=agent.id,
source="dreaming", # Dreaming由来のエントリのみフィルタ
min_confidence=0.7 # 信頼スコア0.7以上のみ
)
for memory in memories:
print(f"[{memory.created_at}] {memory.key}: {memory.value}")
print(f" 信頼スコア: {memory.confidence}")
print(f" 参照回数: {memory.reference_count}")
信頼スコアが低いメモリエントリは定期的にクリーニングする運用を推奨する。
第4章:実際の活用シナリオ
4-1. カスタマーサポートエージェント
課題:毎日100件以上の問い合わせに対応するエージェントが、同じエラーパターンに繰り返し誤った回答をしてしまう。
Dreaming活用:
- 誤答後のユーザー修正パターンをDreamingが抽出
- 「製品バージョンXでは手順Aが異なる」「エラーコードYはZ原因が多い」といったナレッジをメモリに追加
- 翌日以降のセッションで同様のケースに正確に対応できるようになる
期待効果:反復的な誤回答の削減、エスカレーション率の低下
4-2. コードレビューエージェント
課題:チームのコーディング規約がドキュメント化されているが、エージェントが毎回ドキュメントを読み直すのでレイテンシが増加している。
Dreaming活用:
- レビュー中に参照した規約の頻出パターンをDreamingがメモリ化
- 「このチームはasync/awaitの命名規則がXパターン多用」「エラー処理はこのパターンが承認されやすい」を記憶
- ドキュメント参照なしでも高品質なレビューが可能になる
期待効果:レイテンシ削減、コンテキスト使用量の最適化
4-3. Harveyのケーススタディ(法律AI)
Anthropicの公式発表によれば、法律AIスタートアップのHarveyはDreamingのパイロットプログラムに参加し、タスク完了率が約6倍向上したと報告している。
法律文書の分析・契約書レビューといった高度に専門的なタスクでは、「このケースタイプにはこの判例パターンが有効」「このクライアントの文書スタイルに合わせた表現」といった蓄積知識が成否を左右する。
ただし6倍という数値はパイロット環境での結果であり、一般化するには慎重であるべきだ。自社の用途と照らし合わせて評価してほしい。
第5章:Dreamingを使うべきか判断する基準
5-1. 向いているユースケース
Dreamingが効果を発揮しやすいケース:
- 反復頻度が高い:同一エージェントが同類タスクを繰り返す環境
- フィードバックが明確:ユーザーが修正・否定・肯定を頻繁に行う対話型タスク
- ドメイン知識が蓄積可能:法律・医療・コードレビューなど専門ドメイン固有パターンがあるタスク
- チームスケール:複数エージェントが協調するシステム
5-2. 向いていないユースケース
慎重に判断すべきケース:
- 毎回異なるドメイン:多様なタスクをこなす汎用エージェントでは蓄積パターンが薄い
- プライバシーセンシティブ:医療・法律でも個人情報が記憶される設計は慎重な運用が必要(Anthropicのデータポリシーを要確認)
- Research Preview段階:本番クリティカルシステムへの組み込みは仕様安定後を推奨
5-3. コストの考慮
Dreamingは追加のAPI呼び出しを伴うため、トークンコストが増加する。典型的なセッションでのDreaming実行コストはAnthropic公式ドキュメントで確認すること。
大量のエージェントを運用する場合はevery_N_sessionsスケジュールでバランスを取るのが現実的だ。
第6章:今後の展開と注目点
6-1. Managed Agentsロードマップ
2026年5月時点でResearch PreviewのDreamingは、他の3機能(Outcomes・Multiagent Orchestrations・Memory)がPublic Betaに昇格していることを考えると、2026年後半にはPublic Beta化される可能性が高い。
特に注目すべきは:
- チームメモリのアクセス制御:どのエージェントがどのメモリにアクセスできるかの粒度管理
- メモリの有効期限設定:古い知識が新しい方針と矛盾しないよう管理する仕組み
- 監査ログ:Dreamingが何をメモリに追加・変更したかのトレーサビリティ
6-2. 競合動向との比較
Dreamingに類似するコンセプトとして、OpenAIの「Memory」機能(GPT-4oで実装)やMicrosoft Copilotのユーザーレベル学習機能がある。ただしDreamingはセッション横断の集合知・チーム共有メモリという点で差別化されており、エンタープライズ向け大規模マルチエージェントシステムでの優位性が際立つ。
AIエージェント開発スキルを強化したい方へ
Dreamingを含むClaude Managed Agentsの設計を実務で活かすには、エージェントアーキテクチャ全般への理解が重要だ。
AIエージェント・機械学習を体系的に学ぶ
🎓 Coloso — AIエンジニアリング・機械学習実践コース
実装ベースのカリキュラムで、AIエージェントシステムの設計から本番運用まで学べるオンライン学習プラットフォーム。Claude/OpenAI APIを使ったプロダクト開発コースも提供。
※ アフィリエイトリンクです
AIエンジニアとしてのキャリアを加速させたい方
AIエージェント開発スキルを持つエンジニアの市場価値は2026年に入り大きく上昇している。転職・フリーランス化を検討しているエンジニアは無料面談で市場感を把握しておくと良い。
💼 TechGo — AIエンジニア・フリーランス特化の転職エージェント
AIツールを活用できるエンジニアの求人に強く、2026年の市場観測ではAIエージェント経験者の案件単価が前年比20〜30%上昇傾向。無料相談から始められる。
※ アフィリエイトリンクです
まとめ:Dreamingが変えるエージェント設計の考え方
Claude Managed AgentsのDreamingは、エージェントシステムの設計パラダイムに重要な視点を加えた。
これまでの考え方:各セッションは独立。長期的な改善は開発者が手動でメモリ設計をアップデートする。
Dreaming以降の考え方:エージェント自身がジョブ間で経験を整理し、次のセッションに反映する。開発者はシステムを「育てる」設計に移行できる。
この記事のポイント(独自分析: Type C)
- Dreamingは「Memory + スケジューラー」の組み合わせ: 既存Memoryと独立した機能ではなく、セッション間の最適化レイヤーとして機能する
- Outcomesとの組み合わせが鍵: タスク完了条件を明示しないとDreamingの成否判定が曖昧になり学習効果が薄れる
- チームスケールでの集合知が真価: 単エージェントより20+エージェントの協調システムで効果が出やすい
- Research Preview段階 = 実験フェーズ: Harveyの6倍改善は本番クリティカル用途より実験・PoC環境での試用が現実的
- コスト設計が必要: 高頻度ジョブでは
dailyスケジュールでトークンコストをコントロールすること
「エージェントが経験から学ぶ」という方向性は、AIシステム設計の長期的なトレンドと一致している。早めに概念を理解し、実験的な導入を検討するタイミングとして丁度良い段階だ。
参考リンク
- Claude Managed Agents: Dreams - 公式ドキュメント
- New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration - Anthropic Blog
- Code with Claude 2026: 5 New Agent Features - MindStudio
- What Is Claude Dreaming? - felloai
- Anthropic introduces “dreaming” - VentureBeat