ankuro.dev

$ ls blog/tag/

#エージェント

5件の記事

エージェント信頼性の2つの設計——プログラム的前提条件とfew-shotツール選択【CCA Foundations対策】

エージェント信頼性の2つの設計——プログラム的前提条件とfew-shotツール選択【CCA Foundations対策】

エージェントの信頼性を高める2つの設計パターンを整理。プログラム的前提条件はプロンプト指示より確実にワークフローを強制する。few-shotの「理由付き例」は宣言的ルールより曖昧ケースのツール選択を改善する。

続きを読む →
エスカレーションと反復改善——自律解決の判断設計【CCA Foundations対策】

エスカレーションと反復改善——自律解決の判断設計【CCA Foundations対策】

エージェントがいつ自律解決してよくいつ人間にエスカレーションすべきかの判断基準を解説。ポリシーギャップを唯一の確実なエスカレーション基準として捉え、evaluator-optimizerパターンによる自己評価と複数懸念事項の並列処理設計まで。CCA試験Domain 1をカバー。

続きを読む →
コンテキスト最適化とprovenance管理——マルチエージェントの信頼性設計【CCA Foundations対策】

コンテキスト最適化とprovenance管理——マルチエージェントの信頼性設計【CCA Foundations対策】

マルチエージェントシステムの信頼性を高める2つの設計パターンを解説。lost-in-the-middle対策(primacy effect・verbose output削減)と情報のprovenance管理(conflict annotation・coverage注釈・構造化エラー伝播)。CCA試験Domain 1・Domain 5をカバー。

続きを読む →
セッション管理とconfidence scoring——長期タスクと品質計測の設計【CCA Foundations対策】

セッション管理とconfidence scoring——長期タスクと品質計測の設計【CCA Foundations対策】

Claude Codeのセッション管理(--resume・fork_session・named sessions・context isolation)とconfidence scoringの設計パターンを解説。長期タスクの中断・再開、並行探索、信頼スコアのキャリブレーションとstratified samplingによるエラーレート計測。CCA試験Domain 3・Domain 5をカバー。

続きを読む →