すべてのユースケース

AIエージェントコストの自動最適化

Zeroがエージェント実行を監査し、タスクの複雑さで分類、品質を維持しながらコスト削減できるモデル切り替えを提案します。

Zeroの接続先:Slackvm0

Zeroが出力する結果

課題

月末。AIインフラの請求書が届きました:今月は$17K、先月は$12Kでした。調べてみると、毎日のテックデブトスキャン - 数個のgrepスクリプトを実行してGitHub Issueを作成するだけ - がClaude Opusを使っています。マージキューモニターも、CIがグリーンか確認してSlackに投稿するだけなのにOpusです。どちらのタスクもOpusを必要とするようなものではありません。全スケジュールを手動で監査することもできますし、Zeroに各タスクを複雑度で分類させ、ダウングレードを推奨させることもできます。

Zeroによる解決方法

ステップ1:ツールを接続する

vm0
vm0
必須
vm0 - エージェント実行ログ、スケジュール設定、モデル課金データへのアクセスを提供。Zeroはこれを使って各タスクの内容とコストを分析します。
接続
Slack
Slack
必須
Slack - コスト最適化レポートをエンジニアリングまたは開発チャンネルに届けます。
接続

ステップ2:Zeroに聞く

@Zero 全エージェントのスケジュールと実行を監査して。実際の作業内容に基づいて各タスクを低・中・高の複雑度で分類して。品質低下なしにより安価なモデルに切り替え可能なタスクを推奨して。レポートをSlackに投稿して。
Zeroが全エージェント実行とトークン使用量を監査
Zeroがエージェント実行ログを検索し、各タスクが実際に何をしているか - ターン数、ツール呼び出し、推論の複雑さ - を調べ、タスクあたりの現在のコストを計算します。
Zeroがタスクを複雑度階層で分類
Zeroがタスクを3つのバケットに分類します:低複雑度(読んで要約、grepして投稿)、中複雑度(マルチソース集約、構造化分析)、高複雑度(コード生成、オープンエンドな推論)。各階層に推奨モデルが割り当てられます。
Zeroが節約額見積もり付きのアクション可能な推奨事項を投稿
コスト監査がSlackに明確なテーブルで届きます:現在のモデル、推奨モデル、タスクあたりの推定節約額。Zeroはどの切り替えが即座に安全か、品質確認の試用期間が必要かをフラグ付けします。

ステップ3:さらに活用する

低リスクタスクをより安価なモデルに切り替え
最も安全な推奨から始め、品質が維持されることを確認します。
@Zero merge-queue-monitorのスケジュールをSonnetからGLM-5.1に切り替えて
比較テストを実施
両方のモデルで同じタスクを実行し、コミット前に結果を比較します。
@Zero tech-debt-scanのプロンプトをOpusとGLM-5.1の両方で実行して、結果を並べて比較して
定期実行にする
週次のコスト監査をスケジュールして、支出の増加に気づかない事態を防ぎます。
@Zero 毎週月曜午前9時にエージェントコストを監査して、最適化の推奨事項を#devに投稿して

より良い結果のためのヒント

低リスクのタスクから始めましょう - 監視、通知、毎日のサマリーは最初にダウングレードしても安全です。コード生成やオープンエンドな推論は最後に回しましょう。
各切り替えの前後で品質メトリクスを追跡してください。モデル変更後にerror-triage-dailyがIssueを見逃し始めたら、直ちに元に戻してください。
コストレポートは月次ではなく週次で確認しましょう - 小さな漏れはすぐに積み重なり、週次の頻度なら請求書が届く前に問題を発見できます。