← すべてのユースケース

AIエージェントコストの自動最適化

Zeroがエージェント実行を監査し、タスクの複雑さで分類、品質を維持しながらコスト削減できるモデル切り替えを提案します。

Zeroの接続先:

Zeroが出力する結果

AIエージェントコストの自動最適化 — sample output from Zero — screenshot 1

課題

月末。AIインフラの請求書が届きました：今月は$17K、先月は$12Kでした。調べてみると、毎日のテックデブトスキャン - 数個のgrepスクリプトを実行してGitHub Issueを作成するだけ - がClaude Opusを使っています。マージキューモニターも、CIがグリーンか確認してSlackに投稿するだけなのにOpusです。どちらのタスクもOpusを必要とするようなものではありません。全スケジュールを手動で監査することもできますし、Zeroに各タスクを複雑度で分類させ、ダウングレードを推奨させることもできます。

Zeroによる解決方法

ステップ1：ツールを接続する

vm0

必須

vm0 - エージェント実行ログ、スケジュール設定、モデル課金データへのアクセスを提供。Zeroはこれを使って各タスクの内容とコストを分析します。

Slack

必須

Slack - コスト最適化レポートをエンジニアリングまたは開発チャンネルに届けます。

ステップ2：Zeroに聞く

@Zero 全エージェントのスケジュールと実行を監査して。実際の作業内容に基づいて各タスクを低・中・高の複雑度で分類して。品質低下なしにより安価なモデルに切り替え可能なタスクを推奨して。レポートをSlackに投稿して。

試してみる

Zeroが全エージェント実行とトークン使用量を監査

Zeroがエージェント実行ログを検索し、各タスクが実際に何をしているか - ターン数、ツール呼び出し、推論の複雑さ - を調べ、タスクあたりの現在のコストを計算します。

Zeroがタスクを複雑度階層で分類

Zeroがタスクを3つのバケットに分類します：低複雑度（読んで要約、grepして投稿）、中複雑度（マルチソース集約、構造化分析）、高複雑度（コード生成、オープンエンドな推論）。各階層に推奨モデルが割り当てられます。

Zeroが節約額見積もり付きのアクション可能な推奨事項を投稿

コスト監査がSlackに明確なテーブルで届きます：現在のモデル、推奨モデル、タスクあたりの推定節約額。Zeroはどの切り替えが即座に安全か、品質確認の試用期間が必要かをフラグ付けします。

ステップ3：さらに活用する

低リスクタスクをより安価なモデルに切り替え

最も安全な推奨から始め、品質が維持されることを確認します。

@Zero merge-queue-monitorのスケジュールをSonnetからGLM-5.1に切り替えて

試してみる

比較テストを実施

両方のモデルで同じタスクを実行し、コミット前に結果を比較します。

@Zero tech-debt-scanのプロンプトをOpusとGLM-5.1の両方で実行して、結果を並べて比較して

試してみる

定期実行にする

週次のコスト監査をスケジュールして、支出の増加に気づかない事態を防ぎます。

@Zero 毎週月曜午前9時にエージェントコストを監査して、最適化の推奨事項を#devに投稿して

試してみる

より良い結果のためのヒント

●低リスクのタスクから始めましょう - 監視、通知、毎日のサマリーは最初にダウングレードしても安全です。コード生成やオープンエンドな推論は最後に回しましょう。

●各切り替えの前後で品質メトリクスを追跡してください。モデル変更後にerror-triage-dailyがIssueを見逃し始めたら、直ちに元に戻してください。

●コストレポートは月次ではなく週次で確認しましょう - 小さな漏れはすぐに積み重なり、週次の頻度なら請求書が届く前に問題を発見できます。