代码审查 Agent 实战
使用 Sandbox Agent 实现自动化的代码审查、Bug 修复和单元测试生成。
共 35 篇文章
使用 Sandbox Agent 实现自动化的代码审查、Bug 修复和单元测试生成。
构建一个支持网页搜索、文件读取、数据分析和报告生成的研究助手。
从零构建一个支持订单查询、退款处理和 FAQ 的智能客服多 Agent 系统。
OpenAIResponsesModel、OpenAIChatCompletionsModel、LitellmAdapter:适配 100+ LLM。
RunContextWrapper:在 Agent、工具和 Handoff 之间共享应用状态和依赖。
RealtimeAgent + RealtimeRunner:基于 WebSocket 的低延迟语音交互 Agent。
SandboxAgent + Manifest + Capabilities:在隔离工作空间中执行长期任务。
Runner.run_streamed() 和 stream_events():实时接收 LLM 流式输出和事件。
BatchTraceProcessor、自定义 TraceProcessor:将追踪数据发送到自有监控系统。
内置追踪:trace、agent_span、generation_span、function_span 的自动采集与查看。
RunState 序列化、to_state/from_state:中断运行的保存、恢复和继续执行。
needs_approval、interruptions 和 RunState:在关键操作前暂停等待人工审批。
SQLiteSession 和 RedisSession:自动管理跨多次运行的对话历史。
Tool Guardrails:为单个工具配置输入/输出校验和 Tripwire 熔断机制。
Output Guardrails:如何在 Agent 返回结果前校验输出内容。
Input Guardrails:如何在 Agent 执行前校验用户输入,拦截恶意请求,节省成本和资源。
HandoffInputData、input_filter 和 nest_handoff_history:控制交接时的上下文传递。
LLM 编排 vs 代码编排:两种策略的适用场景、优缺点和混合使用方案。
Manager-Specialist 模式:使用 Agent.as_tool() 构建分层多智能体系统。
Handoff 详解:如何实现 Agent 之间的任务委托、输入过滤和会话嵌套,构建专业的多智能体系统。
ComputerTool、ShellTool、ApplyPatchTool:在沙箱环境中执行代码和文件操作。
集成 Model Context Protocol (MCP) 工具:本地 STDIO、SSE 和托管 MCP 服务器。
Agent.as_tool() 模式:让一个 Agent 成为另一个 Agent 的工具,实现管理器模式。
ToolSearchTool 和 tool_namespace:如何在运行时按需加载大量工具。
WebSearchTool、FileSearchTool、CodeInterpreterTool、ImageGenerationTool 等托管工具详解。
使用 @function_tool 装饰器将任意 Python 函数封装为 Agent 可调用的工具,支持类型注解、文档字符串和结构化参数。
Agent 生命周期事件:on_start、on_end、on_handoff 等 Hook 的注册与使用。
使用 Pydantic 模型定义 output_type,让 Agent 返回类型安全的数据结构。
ModelSettings 详解:temperature、top_p、tool_choice,以及多模型提供商适配。
如何编写高质量的 Agent 指令,以及使用动态提示词模板和回调函数。
深入解析 Agent 的全部配置项:name、instructions、model、tools、guardrails、handoffs 等。
系统梳理 Agents SDK 的 9 大核心概念及其相互关系,建立完整的知识地图。
从零开始编写并运行第一个 Agents SDK 程序,理解 Agent、Runner 和 RunResult 的关系。
详解 Python 虚拟环境、API Key 配置、可选依赖安装,以及 uv 和 pip 两种方案的选择建议。
OpenAI Agents SDK 是一个轻量而强大的多智能体工作流框架,支持 OpenAI Responses API、Chat Completions API 以及 100+ 其他 LLM。本文带你快速了解 SDK 的核心架构与设计理念。