Claude Code × Cloudflare Workers でゼロランタイムコスト AI エージェントを組む 2026 年 5 月末版|個人開発者の月額¥0 運用パターンと無料枠の実測

Claude Code × Cloudflare Workers でゼロランタイムコスト AI エージェントを組む 2026 年 5 月末版|個人開発者の月額¥0 運用パターンと無料枠の実測


Claude Code × Cloudflare Workers でゼロランタイムコスト AI エージェントを組む 2026 年 5 月末版 — 個人開発者の月額¥0 運用パターンと無料枠の実測

PR: 本記事にはアフィリエイトリンク(プロモーション)が含まれます。掲載するサービスは編集部が記事内容との関連性で選定しており、報酬の有無で評価を変えていません。

この記事でわかること: Cloudflare Workers / Workers AI / KV / D1 / Durable Objects / cron triggers の無料枠を踏まえた 6 つの AI エージェント設計パターンと、Anthropic API キーを Workers Secrets で扱う実装、運用上の落とし穴 5 つの回避策。 想定読者: 個人開発者 / 副業エンジニア / 月額固定費を増やさずに AI エージェントを常時稼働させたい方。 前提知識: TypeScript / wrangler CLI / 環境変数の扱い、HTTP リクエストの基本。 読了時間目安: 約 11 分。 検証環境: macOS 14.5 / wrangler 3.78.x / Node.js 20.10.0 / @anthropic-ai/sdk 0.30.x / Workers AI llama-3.1-8b-instruct (2026-05-28 時点)。


「個人開発で AI エージェントを 24 時間動かしたい。でも VPS で月 ¥1,500、Lambda + RDS で月 ¥2,000、Vercel Pro で $20/月。固定費が嵩む」。

これは個人開発者・副業エンジニアの典型的な悩みだ。

しかし、Cloudflare Workers の無料枠 (日次 100,000 リクエスト) と Workers AI / KV / D1 / cron triggers の無料枠を組み合わせると、Claude Code で生成した AI エージェントを 月額¥0 〜数百円で常時稼働させられる (個人検証範囲・後述の制限あり)。

本記事では、筆者が 2026 年 5 月時点で稼働中の 6 つの実装パターンと、無料枠の実測値・コールドスタート / レイテンシ / cron trigger の制約まで実装ベースで公開する。


なぜ「Claude Code × Cloudflare Workers」が個人開発の現実解なのか

Anthropic は 2025 年末以降、Claude Code を CLI として公式提供し、claude -p (one-shot) と Agent SDK (長期実行) の 2 系統で外部プログラムから呼び出せるようにした。一方、Cloudflare は 2024 年に Workers AI を GA し、エッジで LLM 推論を走らせられるようにした。Anthropic SDK (高品質生成) と Workers AI (推論コストゼロ・軽量タスク) を役割分担すると、月額¥0 運用の現実味が出てくる。

Cloudflare Workers の無料枠は公式ドキュメント (https://developers.cloudflare.com/workers/platform/pricing/) によれば 2026 年 5 月時点で 日次 100,000 リクエスト・10ms CPU time / リクエスト。Workers AI は 日次 10,000 Neurons (モデル別の重み付き演算単位) が無料枠 (公式: https://developers.cloudflare.com/workers-ai/platform/pricing/)。**この 2 つの枠内に収まる設計**なら月額固定費はゼロだ。

VPS / Lambda 構成Workers + Claude Code 構成
月額固定費¥1,500-2,500¥0-数百円 (API call 量次第)
コールドスタートLambda 1-3 秒Workers 〜数 ms (V8 isolate)
デプロイ時間docker push 1-3 分wrangler deploy 数秒
グローバル分散リージョン固定300+ エッジ自動分散
シークレット管理.env / SSMwrangler secret put

注意: 無料枠は 2026 年 5 月時点の値。Cloudflare は無料枠を頻繁に改訂するため、運用前に公式ドキュメントの最新値を必ず確認すること。Anthropic 側の API 料金は別途発生する (例として 2026-05 時点の Sonnet 系で input $3 / output $15 per MTok 前後・モデル世代によって変動・公式: https://www.anthropic.com/pricing#anthropic-api )。利用する Claude モデルの世代と価格は API call 時点の公式 pricing を都度確認すること。


6 つの実装パターン

パターン 1: 定期 RSS 要約エージェント (cron triggers + Claude API)

最も古典的かつ堅牢なパターン。Workers の cron triggers (公式 doc: https://developers.cloudflare.com/workers/configuration/cron-triggers/ ・2026-05-29 時点) で毎朝 9:00 JST に発火し、RSS を fetch → Claude API で要約 → KV に保存。cron 件数や同時実行の上限は公式 doc の最新値を確認すること。

// wrangler.toml で [triggers] crons = ["0 0 * * *"] (UTC) を指定
import Anthropic from "@anthropic-ai/sdk";

export default {
  async scheduled(event: ScheduledEvent, env: Env, ctx: ExecutionContext) {
    const feeds = ["https://example.com/rss"];
    const anthropic = new Anthropic({ apiKey: env.ANTHROPIC_API_KEY });
    for (const url of feeds) {
      const xml = await (await fetch(url)).text();
      const summary = await anthropic.messages.create({
        model: "claude-3-5-haiku-20241022", // 軽量モデルでコスト最小化
        max_tokens: 512,
        messages: [{ role: "user", content: `次の RSS を 200 字で要約: ${xml.slice(0, 8000)}` }],
      });
      await env.KV.put(`summary:${new Date().toISOString().slice(0, 10)}:${url}`, summary.content[0].text, { expirationTtl: 86400 * 7 });
    }
  },
};

所要コスト (筆者測定・10 feed / 日): Workers 0 円、Anthropic API は Haiku 利用で月 ¥30-50 程度。無料枠 100% 内で運用可能

パターン 2: Workers AI で前処理 → Anthropic で本処理 (2 段推論)

Workers AI の llama-3.1-8b-instruct (Neurons 単価が安い) で「カテゴリ分類」「重要度判定」を済ませ、本当に必要なものだけ Anthropic Claude に渡す。Anthropic API 呼び出し回数を 1/3 〜 1/5 に削減できる。

// Workers AI で重要度スコアリング (無料枠 10,000 Neurons / 日)
const score = await env.AI.run("@cf/meta/llama-3.1-8b-instruct", {
  messages: [{ role: "user", content: `次の記事の重要度を 0-10 で返せ: ${title}` }],
});
if (parseInt(score.response) >= 7) {
  // Claude で本文生成 (高品質が必要なものだけ)
  await anthropic.messages.create({...});
}

筆者の RSS pipeline (n=180 feed / 日) では、Workers AI で 70% を足切りした結果、Claude API コストが月 ¥250 → 月 ¥75 程度に下落した (2026 年 4-5 月の 2 ヶ月単月実測値・対象 feed の構成変更で前後あり・標準偏差や信頼区間は手元データ点数が少なく算出していない。再現性は feed 構成と Claude モデル選択に強く依存)。

パターン 3: Webhook 受信 → Durable Objects で状態管理

Slack / Discord / GitHub webhook を受けて Claude で応答を生成し、ユーザー単位の会話履歴を Durable Objects で保持。Durable Objects は無料枠で 100,000 リクエスト / 日・1 GB ストレージまで。

ポイントは 会話履歴を JSON で持たず「直近 N ターン + 過去要約」の形式で持つこと。トークン消費が無制限に膨らむのを防げる。

パターン 4: D1 (SQLite) で長期メモリ

Cloudflare D1 (公式 doc: https://developers.cloudflare.com/d1/platform/pricing/ ・2026-05-29 時点の無料枠は「5GB ストレージ・読み 5M 行 / 日・書き 100K 行 / 日」程度) を AI エージェントの長期メモリとして使う。Claude Code で生成したスキーマをそのまま wrangler d1 execute で適用できる。具体的な数値は公式 pricing ページの最新値を必ず確認すること。

CREATE TABLE memories (
  id INTEGER PRIMARY KEY AUTOINCREMENT,
  user_id TEXT NOT NULL,
  content TEXT NOT NULL,
  embedding BLOB, -- Workers AI bge-small-en-v1.5 で生成
  created_at INTEGER DEFAULT (unixepoch())
);
CREATE INDEX idx_memories_user ON memories(user_id);

embedding は Workers AI で生成すれば外部 vector DB が不要。pgvector を使うために RDS / Supabase を契約する必要が消える。

パターン 5: Queue で長時間バッチを分割

Workers は CPU time の上限 (無料プランで 10ms / リクエスト・有料プラン上限は公式 doc 参照) に縛られる (HTTP request の wall time は client 接続が続く限り強制終了されない設計だが、CPU 集約な処理は途中で停止される)。だが Cloudflare Queues (無料枠 100,000 メッセージ / 月) を挟むと、大量 RSS / 大量 URL の分散処理ができる。

producer Worker が URL を 100 件 enqueue → consumer Worker が 1 件ずつ取り出して Claude で処理 → D1 に保存。各 invocation は数秒で終わるので 30 秒制限を踏まない。

パターン 6: API Gateway パターン (Claude をフロント Worker から呼ぶ)

自作 SaaS / 個人プロダクトのフロントエンドから Claude を呼ぶ場合、API キーをブラウザに置くのは禁忌。Workers をプロキシ層にして API キーは wrangler secret put ANTHROPIC_API_KEY で Workers Secrets に格納、フロントは独自トークンで Worker を叩く。

export default {
  async fetch(req: Request, env: Env): Promise<Response> {
    const auth = req.headers.get("Authorization");
    if (auth !== `Bearer ${env.MY_APP_TOKEN}`) return new Response("Unauthorized", { status: 401 });
    const body = await req.json();
    const anthropic = new Anthropic({ apiKey: env.ANTHROPIC_API_KEY });
    const res = await anthropic.messages.create({ model: "claude-3-5-sonnet-20241022", max_tokens: 1024, messages: body.messages });
    return Response.json(res);
  },
};

rate limit を Cloudflare KV で実装すれば、Free tier の DDoS 保護と組み合わせて個人 SaaS の API 層が ¥0 で完成する。


無料枠の実測値 (2026 年 5 月末)

筆者の 2 つの個人プロダクト (RSS 要約 SaaS、Discord bot) で実測した値。

サービス無料枠 (公式 doc)筆者の月間使用量月額
Workers (リクエスト)100,000 / 日約 18,000 / 日¥0
Workers (CPU 時間)10ms / req平均 3.2ms¥0
Workers AI (Neurons)10,000 / 日約 4,200 / 日¥0
KV (読み / 書き)100K / 日, 1K / 日約 12K / 日, 800 / 日¥0
D1 (読み / 書き)5M / 日, 100K / 日 (2026-05 時点公式)約 280K / 日, 5K / 日¥0
Durable Objects100K / 日約 8K / 日¥0
Queues100K msg / 月約 35K / 月¥0
Anthropic API (Haiku 中心)約 4M input tokens / 月¥320 (約 $2)

合計: 月額 ¥320 (Anthropic API 分のみ・1 USD ≒ ¥160 換算)。VPS + RDS の従来構成 (月 ¥2,000) から 85% 削減できた。

上記値はあくまで筆者環境 (個人プロダクト 2 個・小規模トラフィック) の実測。SaaS として有料ユーザーが付いた瞬間にトラフィックが 10x になることはざらにあるので、無料枠が常に持続するわけではない点に注意。


落とし穴 5 つの回避策

落とし穴 1: cron triggers の最小実行間隔

Cloudflare cron triggers は 最小 1 分間隔。秒単位の polling は不可。短い間隔が必要なら Durable Objects の alarm() に切り替える。

落とし穴 2: Workers の CPU time 制限と wall time の混同

無料プランでは 1 invocation あたり CPU time 10ms 上限。HTTP request の wall time は client 接続が続く限り強制 timeout されない設計だが、CPU 集約な処理 (大きい JSON parse / 重い計算) は CPU time 上限で打ち切られる。Claude API の長い応答 (streaming) を待つだけなら CPU time はほぼ消費しないが、応答を JSON.parse して整形する処理は CPU を食う。streaming で受けて KV に途中保存 → 別 Worker で続きを処理するか、ジョブを Queues に分割するのが安全。CPU time の上限値は公式 pricing doc の最新値を確認すること。

落とし穴 3: Anthropic API キーの露出事故

.envgit add してしまう事故は依然多い。wrangler secret put 経由でしか API キーを設定しない運用 + pre-commit hook で .env 検知を入れる。Workers 内では env.ANTHROPIC_API_KEY でしかアクセスできない設計にする (process.env 経由禁止)。

補足 (キャリア観点): Workers Secrets / Anthropic API キーの安全な扱いは、AI × エッジ実装案件で必ず最初に問われるポイント。副業 / フリーランスでこの設計ができるエンジニアは 2026 年時点でまだ希少なので、市場相場を一度キャリブレーションしておくと交渉時の time-saver になる (TechGo の無料面談 はエンジニア特化型の案件 / 転職相談で、面談だけでもオファー相場の比較材料になる)。

落とし穴 4: Workers AI のモデル制限

Workers AI の無料枠 (10K Neurons / 日) は llama-3.1-8b 程度なら数百回動かせるが、大型モデル (llama-3.1-70b) では数十回で枯渇する。軽量タスクは Workers AI、品質が必要なものは Anthropic の割り切りが必須。

落とし穴 5: グローバル分散の落とし穴 (地理的不整合)

Workers は 300+ エッジで動くため、KV / D1 への書き込みが「アジア → 北米」と分散すると eventual consistency の遅延 (数百 ms 〜数秒) が発生する。トランザクション性が必要なものは Durable Objects (シングルロケーション保証) を使う。


キャリア戦略との接続

ここまで読んで「自分も Cloudflare Workers × Claude の構成で個人 SaaS を作りたい」と感じた読者には、2 つの方向性を提案したい。

  1. 副業 / フリーランスで AI 構築案件を取りに行く — エッジ x AI の組合せ実装ができるエンジニアは 2026 年時点で需要が高い。エンジニア特化型の案件 / 転職プラットフォームを 1 社抑えて市場相場をキャリブレーションしておくと、副業時給の交渉力が変わる。TechGo の無料面談 は AI / SaaS 領域の案件・転職を扱っており、面談だけでも相場感のキャリブレーションになる。
  2. AI / Claude Code の体系学習で設計判断を高速化 — 独学でも作れるが、「どこを Anthropic、どこを Workers AI、どこを D1 に置くか」の設計判断は経験依存になりがち。Coloso のプログラミング・AI 関連講座 で体系的に押さえると、手戻りが半減する。

どちらも無料登録 / 無料面談から開始できるので、まず 1 つ動かして相場感を取りに行くのが現実解だ。


まとめ

項目キーポイント
構成Workers + Workers AI + KV / D1 / DO + Anthropic API
月額¥0 〜数百円 (個人開発スケール時)
設計原則軽量タスク = Workers AI、品質必須 = Anthropic、状態 = DO / D1
落とし穴cron 1 分制限 / 30 秒 timeout / API キー露出 / Neurons 枯渇 / 結果整合性
次の一歩1 個目のパターン (cron + RSS 要約) を 30 分で動かしてみる

個人開発で AI エージェントを常時稼働させたいのに月額固定費を増やしたくない、というジレンマは、2026 年の Cloudflare Workers と Anthropic API でほぼ解消できる。手元の RSS 1 本から wrangler deploy してみてほしい。


関連記事


本記事の数値は 2026 年 5 月末時点の公式ドキュメント・筆者環境での実測値に基づきます。Cloudflare の無料枠・Anthropic の料金体系は頻繁に改訂されるため、運用前に各公式ドキュメントの最新値を必ず確認してください。