代码审查 Agent 实战
使用 Sandbox Agent 实现自动化的代码审查、Bug 修复和单元测试生成。
共 84 篇文章
使用 Sandbox Agent 实现自动化的代码审查、Bug 修复和单元测试生成。
构建一个支持网页搜索、文件读取、数据分析和报告生成的研究助手。
从零构建一个支持订单查询、退款处理和 FAQ 的智能客服多 Agent 系统。
OpenAIResponsesModel、OpenAIChatCompletionsModel、LitellmAdapter:适配 100+ LLM。
RunContextWrapper:在 Agent、工具和 Handoff 之间共享应用状态和依赖。
RealtimeAgent + RealtimeRunner:基于 WebSocket 的低延迟语音交互 Agent。
SandboxAgent + Manifest + Capabilities:在隔离工作空间中执行长期任务。
Runner.run_streamed() 和 stream_events():实时接收 LLM 流式输出和事件。
BatchTraceProcessor、自定义 TraceProcessor:将追踪数据发送到自有监控系统。
内置追踪:trace、agent_span、generation_span、function_span 的自动采集与查看。
RunState 序列化、to_state/from_state:中断运行的保存、恢复和继续执行。
needs_approval、interruptions 和 RunState:在关键操作前暂停等待人工审批。
SQLiteSession 和 RedisSession:自动管理跨多次运行的对话历史。
Tool Guardrails:为单个工具配置输入/输出校验和 Tripwire 熔断机制。
Output Guardrails:如何在 Agent 返回结果前校验输出内容。
Input Guardrails:如何在 Agent 执行前校验用户输入,拦截恶意请求,节省成本和资源。
HandoffInputData、input_filter 和 nest_handoff_history:控制交接时的上下文传递。
LLM 编排 vs 代码编排:两种策略的适用场景、优缺点和混合使用方案。
Manager-Specialist 模式:使用 Agent.as_tool() 构建分层多智能体系统。
Handoff 详解:如何实现 Agent 之间的任务委托、输入过滤和会话嵌套,构建专业的多智能体系统。
ComputerTool、ShellTool、ApplyPatchTool:在沙箱环境中执行代码和文件操作。
集成 Model Context Protocol (MCP) 工具:本地 STDIO、SSE 和托管 MCP 服务器。
Agent.as_tool() 模式:让一个 Agent 成为另一个 Agent 的工具,实现管理器模式。
ToolSearchTool 和 tool_namespace:如何在运行时按需加载大量工具。
WebSearchTool、FileSearchTool、CodeInterpreterTool、ImageGenerationTool 等托管工具详解。
使用 @function_tool 装饰器将任意 Python 函数封装为 Agent 可调用的工具,支持类型注解、文档字符串和结构化参数。
Agent 生命周期事件:on_start、on_end、on_handoff 等 Hook 的注册与使用。
使用 Pydantic 模型定义 output_type,让 Agent 返回类型安全的数据结构。
ModelSettings 详解:temperature、top_p、tool_choice,以及多模型提供商适配。
如何编写高质量的 Agent 指令,以及使用动态提示词模板和回调函数。
深入解析 Agent 的全部配置项:name、instructions、model、tools、guardrails、handoffs 等。
系统梳理 Agents SDK 的 9 大核心概念及其相互关系,建立完整的知识地图。
从零开始编写并运行第一个 Agents SDK 程序,理解 Agent、Runner 和 RunResult 的关系。
详解 Python 虚拟环境、API Key 配置、可选依赖安装,以及 uv 和 pip 两种方案的选择建议。
OpenAI Agents SDK 是一个轻量而强大的多智能体工作流框架,支持 OpenAI Responses API、Chat Completions API 以及 100+ 其他 LLM。本文带你快速了解 SDK 的核心架构与设计理念。
测试数学公式渲染、Mermaid图表显示、代码高亮和复制功能
构建LLM Agent的质量评分与监控闭环,详解离线评测体系、在线可观测性及关键性性能指标。
探讨架构设计中的平衡艺术,从性能、质量到成本控制,并提供纯云端与私有化部署的参考蓝图。
提供LLM Agent的工程化落地清单,包括环境搭建、工具注册及基于Docker的部署容器化实践指南。
深入分析基于安全要求与性能需求的架构选型,涵盖低延迟架构与高安全防护体系的构建方法。
基于任务复杂度的Agent方案选型指南,从API查询助手到企业级数据分析,匹配最优技术架构。
实测分析代码生成、审查Agent及数据分析Agent的架构设计,提供自动化工作流与质量控制的实操参考。
以企业智能客服为例,拆解Agent在真实业务场景中的意图识别、RAG增强及对话管理实现要点。
对比主流编排引擎LangGraph与LangChain,展示图式编排与链式组合的实际代码示例及应用差异。
解析记忆增强模式与规则/符号融合模式,探索如何利用持久化记忆与形式化约束提升Agent的可信度与逻辑性。
概览LLM Agent的高级架构模式,为处理极高复杂度的业务逻辑提供进阶思路与技术选型方案。
探讨RAG增强型Agent与反思/自监督模式,如何通过外部知识引入与自我修正提升Agent的输出质量。
介绍Router-Worker-Critic多Agent协作模式的原理,详解复杂任务下的专业化分工与质量把控关键点。
剖析“规划—执行—评估”闭环架构,深入探讨ReAct与Plan-Execute模式的核心机制及优缺点方案。
详解单Agent+工具调用这一最基础且常用的架构模式,涵盖标准化工具设计与智能体决策逻辑。
通过对主流Agent架构模式的深度对比,揭示各组件间的交互机制,为系统化架构设计提供全局视角。
深入剖析Agent的交互层与编排控制层组件,详解对话管理、多模态处理及任务规划的核心实现逻辑。
分析LLM Agent的部署模式,包括功能增强模式(RAG/符号融合)与编排协作模式(集中式vs分布式)。
详细对比单Agent与多Agent架构的特点,从复杂度、一致性及容错性等多维度提供架构选型决策参考。
术语与假设 -解析LLM Agent定义及其与普通LLM调用的本质区别,重点介绍工具调用、长期记忆及多回合交互的核心假设。
LLM Agent核心架构模式概览 - 深入探讨LLM Agent的核心架构设计模式,对比分析单Agent与多Agent系统的优劣及适用场景,为构建高效AI助手提供理论基础。
详解Grover量子搜索算法,揭示其在无序数据库中实现平方级加速的Oracle设计与振幅放大过程。
实战演示Simon周期发现算法,通过Qiskit代码实现与电路图解析,展现量子并行性的力量。
开启量子算法之旅:深入学习量子计算首个算法——Deutsch算法的问题背景、原理及其对比经典的高效性。
量子计算的工程挑战:分析超导、离子阱等物理载体实现,探讨环境噪声与去相干机制对保真度的影响。
深度对比量子比特与经典比特,解析量子不可克隆定理背后的信息安全性与计算资源利用率差异。
探索量子电路基础,通过H门制备叠加态,图解相位如何干涉并决定测量概率的物理奥秘。
量子计算入门基石:详解量子比特(Qubit)定义、Dirac态矢量表示以及叠加原理在Bloch球上的几何直观。
介绍使用PyQt5开发桌面应用的方法,包括环境配置、UI布局(Layout)、Widget控件、Signal/Slot事件机制以及使用pyinstaller打包发布。
介绍扩展UE实现C++分布式编译的方案,参考FASTBuild原理,将编译分为预处理、远程编译、结果合并等Pipeline阶段。
介绍MSVC的sln工程编译方法,包括cl.exe和linker.exe的使用,CL命令格式,环境变量配置,预处理、编译、链接及动态链接库生成等完整流程。
介绍Windows下常用的路径复制工具,包括COPY、XCOPY、ROBOCOPY等命令的使用方法和常用参数配置。
介绍AutoHotkey(AHK)工具用于定义系统快捷键和模拟输入,支持丰富的接口实现键盘鼠标自动化操作。
VLC播放器相关配置和使用方法,介绍这款开源多媒体播放器的功能和设置选项。
介绍如何使用FastAPI快速搭建HTTP服务,包括环境安装、GET/POST接口示例、uvicorn启动以及gunicorn生产环境部署。
介绍如何定制UE的崩溃报告器,包括分析CrashReporter调用流程、断点调试方法、DataRouter上报参数以及自定义HTTP上报的修改方案。
介绍如何通过注册表脚本为VS Code添加右键菜单支持,包括单个文件、目录和空白处的右键打开方式。
记录百度网盘API的使用方法,包括创建应用、OAuth2.0授权流程、AccessToken获取与刷新、API调用示例等。
记录在UE中定义日志类别和使用的方法,包括头文件声明、CPP中实现DEFINE_LOG_CATEGORY,以及日志级别、环境变量和命令行配置。
介绍如何将Windows程序注册为系统服务,使用instsrv.exe和srvany.exe工具实现后台持续运行,包括服务创建、参数配置和删除方法。
介绍使用pyinstaller将Python程序打包为Windows EXE可执行文件的方法,包括单文件打包、图标设置和常用命令行参数。
介绍如何将Hexo的代码高亮从默认highlight替换为prism.js,包括禁用默认配置、下载prism资源文件和配置方法。
扩展UE5的Shader编译器实现多机分布式编译,通过Socket/NamedPipe通信,REDIS任务队列管理,支持多台机器共享算力加速Shader编译。
记录开发虚幻引擎插件并上架商城的流程,包括注册卖家账号、开通开发者申请、插件开发、上架和收益管理等步骤。
介绍如何在UE编辑器中添加自定义配置项,通过UObject和config属性创建可编辑的设置面板,方便用户配置扩展功能。
分析UE5中FShaderCompilingManager的Shader编译流程,介绍分布式编译框架FShaderCompileDistributedThreadRunnable_Interface和XGE/FASTBuild控制器原理。
深入研究UE的热重载机制,分析AbandonModuleWithCallback、ModuleManager.LoadModule、目录监控等核心代码流程。
梳理虚幻引擎开发的核心知识框架,包括UObject系统、Gameplay架构、反射机制、内存管理、序列化、主要对象生命周期和引擎流程。
Hexo博客框架的初始化配置,包括创建新文章、运行服务器、生成静态文件以及部署到远程站点等基本操作指南。