
D1直前対策チートシート——エージェント・ワークフロー設計(試験比率27%)【CCA Foundations対策】
CCA Foundations試験のDomain 1「エージェント・ワークフロー設計」の直前対策まとめ。ツール設計・エージェントループ・マルチエージェント・エスカレーション・エラー伝播の判断軸を表とリストで整理。
続きを読む →$ ls blog/tag/
21件の記事

CCA Foundations試験のDomain 1「エージェント・ワークフロー設計」の直前対策まとめ。ツール設計・エージェントループ・マルチエージェント・エスカレーション・エラー伝播の判断軸を表とリストで整理。
続きを読む →
CCA Foundations試験のDomain 2「Claude API・SDK実装」の直前対策まとめ。Messages API・ストリーミング・構造化出力・Batch APIの使い分けと判断軸を表とリストで整理。
続きを読む →
CCA Foundations試験のDomain 4「プロンプト設計・信頼性・パフォーマンス」の直前対策まとめ。few-shot設計・明確な基準・ツール説明文・一貫性向上の手法を表とリストで整理。
続きを読む →
CCA Foundations試験のDomain 5「評価・改善・品質計測」の直前対策まとめ。Eval設計・false positive削減・confidence scoring・coverage注釈・self-evaluationの判断軸を表とリストで整理。
続きを読む →
Message Batches APIの50%コスト削減は魅力的だが、すべてのワークフローに使えるわけではない。fire-and-forgetモデルがツール呼び出しループを壊す理由と、latency-tolerantなタスクとの正しい対応関係を整理する。
続きを読む →
エージェントの信頼性を高める2つの設計パターンを整理。プログラム的前提条件はプロンプト指示より確実にワークフローを強制する。few-shotの「理由付き例」は宣言的ルールより曖昧ケースのツール選択を改善する。
続きを読む →
ClaudeのTool Useを実際に動かす実装を解説。マルチブロックレスポンスの読み方・tool_resultの返し方・stop_reasonでループを制御するエージェントループの実装まで、気象情報取得ツールを例に追う。
続きを読む →
Tool Useの応用を解説。複数ツールのルーター設計・ツール過多が選択信頼性を下げる理由・tool_choice の3つのモード・ストリーミング時のfine-grainedオプション・テキスト編集・Web検索の組み込みツールまで網羅。
続きを読む →
Claude APIでワークフローを設計する4つのパターンを解説。並列化・直列(チェーニング)・評価ループ(Evaluator-Optimizer)・ルーティングの仕組みと使い分けを具体的なユースケースとともに整理する。
続きを読む →
Claude APIでエージェントを設計する考え方を解説。抽象的なツール設計の原則・環境観察の重要性・ワークフローとの使い分け判断軸を整理。CCA試験で頻出のcoordinator-subagentパターンとコンテキスト継承の落とし穴も解説。
続きを読む →
エージェントがいつ自律解決してよくいつ人間にエスカレーションすべきかの判断基準を解説。ポリシーギャップを唯一の確実なエスカレーション基準として捉え、evaluator-optimizerパターンによる自己評価と複数懸念事項の並列処理設計まで。CCA試験Domain 1をカバー。
続きを読む →
マルチエージェントシステムの信頼性を高める2つの設計パターンを解説。lost-in-the-middle対策(primacy effect・verbose output削減)と情報のprovenance管理(conflict annotation・coverage注釈・構造化エラー伝播)。CCA試験Domain 1・Domain 5をカバー。
続きを読む →
Claude Codeのセッション管理(--resume・fork_session・named sessions・context isolation)とconfidence scoringの設計パターンを解説。長期タスクの中断・再開、並行探索、信頼スコアのキャリブレーションとstratified samplingによるエラーレート計測。CCA試験Domain 3・Domain 5をカバー。
続きを読む →
プロンプトエンジニアリングの基本2テクニックを解説。「明確・直接的に書く」「具体的に指示する」の2つを適用するだけで、スコアが3.1から8.3まで改善する過程をコードと数値で追う。
続きを読む →
プロンプトエンジニアリングの残り2テクニックを解説。XMLタグで構造を明示し、few-shotで曖昧なケースの判断を伝える——2テクニックを加えてスコアが8.3から9.1まで改善する過程を追う。
続きを読む →
ClaudeのTool Useの仕組みを基礎から解説。ツール関数の書き方・JSON schemaの設計・descriptionが選択信頼性を左右する理由まで、株価取得ツールを例に実装を追う。
続きを読む →
Claude APIをPythonで動かすまでの全ステップを解説。Opus・Sonnet・Haikuの選び方、APIキーの安全な管理、レスポンス取得まで——初心者がつまずくポイントと注意点も含めて理解できる。
続きを読む →
Claude APIでマルチターン会話を実装する方法を解説。ステートレスなAPIで会話履歴を管理する仕組み、システムプロンプトの設計原則、Temperatureの使い分けまで——よくある落とし穴も含めて理解できる。
続きを読む →
Claude APIのレスポンスをストリーミングで即時表示する方法、プリフィル+ストップシーケンスによるJSON生成、tool_useによる確実な構造化出力の違いまで解説。
続きを読む →
プロンプトの品質を「勘」ではなくスコアで測るEvalパイプラインの考え方を解説。5ステップのEvalワークフロー、グレーダー設計の落とし穴、独立評価インスタンスの重要性まで踏み込んで理解できる。
続きを読む →
Evalパイプラインをコードで実装する。Claudeでテストデータを自動生成し、モデルベース採点のfew-shot活用、バリデーション失敗時のリトライパターン、コードベース採点を組み合わせた実践的なEvalを解説。
続きを読む →