🌟 欢迎订阅 TGLTommy 会员课程,这是一套面向长期学习者的会员专享内容。课程采用按月订阅制,围绕不同主题持续更新,帮助你不断跟进最新技术、最新案例与最新实践。
🎯 订阅期间,你可以持续获取:
✅ 已上线的全部会员课程内容
✅ 后续新增专题与更新内容
✅ 会员专属课程资料
✅ 会员专属学习交流群(仅用作会员交流,与精品课程专享 AI 技术学习圈不同)
*本课程不设每月固定更新频次,具体更新将根据课程专题、项目实践和内容规划安排推进。你可以根据自己的学习需求和学习进度进行订阅~
🔔 如需通过淘宝或微信进行支付,请点此查看《微信小店/淘宝购买指引》。
本节课带你做一个智能电商客服 Demo:
Skill = 知识模块(退款政策 / 产品 FAQ / 故障排查),按需加载,不再堆 Prompt
MCP = 执行工具(查订单/检查支付/执行退款/创建工单/对接CRM),让 Agent 真的能办事
实战覆盖 3 个高频场景:
🔹 退款闭环:政策判断 → 查单 → 资格判断 → 退款 → 工单记录
🔹 产品咨询:多 Skill 动态选择,快速给推荐与对比
🔹 故障排查+查单跨域协作:并行工具调用,合并结果给可执行方案
🔹 开发用 stdio,生产用 HTTP 的部署形态怎么选。
本期带你从0到1跑通 AgentEvolver 的 AppWorld 实战:一个让 Agent 能“自己教自己”的自进化训练框架(Self-Questioning / Self-Navigating / Self-Attributing)。
你将学到:
🔹 AgentEvolver 三大核心机制到底在解决什么问题(自动生成任务 / 失败经验学习 / 步骤级奖励归因)
🔹 AppWorld 是什么、为什么适合作为入门环境(Python REPL + 457 个可调用 API + 多步骤任务)
🔹 最小化训练示例:只用环境内置数据集做基础 GRPO 训练(先把流程跑通)
🔹 环境服务如何启动、如何用 curl 验证服务正常
🔹 配置文件 basic.yaml 的关键点:禁用经验管理 ReMe、禁用 ADCA-GRPO,自顶向下理解训练入口
本系列课程将带你深入理解 Agent Lightning —— 微软研究院提出的零代码强化学习(RL)优化 AI Agent 的工业级方案。
本节课程重点讲解 Spider SQL Agent:
🔹 多轮交互式 SQL 生成与验证
🔹 基于奖励信号的强化学习优化
🔹 LangGraph 状态管理 + Agent Lightning 强化学习框架
🔹 Spider 数据集驱动的 SQL 查询优化
通过本节学习,你将完整掌握 从环境搭建、数据准备、Agent 实现、提示词策略、训练框架到RL优化 的全流程,为构建智能 SQL Agent 提供实战参考。
本节课程带你全面解析 智能计算 Agent 项目 Calc-X,一个通过 AutoGen 与 AgentLightning 框架 无缝集成的数学计算 AI Agent 实战案例。
核心亮点包括:
🔹 AutoGen 多智能体对话系统 的应用与扩展
🔹 AgentLightning 框架 + vLLM 高性能推理服务器 的集成
🔹 MCP (Model Context Protocol) 工具调用与计算器服务器实践
🔹 强化学习 (RL) 在智能 Agent 训练中的奖励优化流程
通过本课程,你将学习如何 构建、训练与优化一个可执行数学计算任务的 AI Agent,并深入理解 多智能体协作 + 工具调用 + RL 奖励反馈 的完整闭环。
本项⽬基于 Agent Lightning 框架实现了⼀个⽀持检索增强⽣成(RAG)的智能 Agent 系统。
该系统通过 WebQA 知识库检索相关信息来回答⽤户问题,并采⽤强化学习进⾏优化训练。主要解决了传统 RAG 系统答案质量不稳定、检索相关性不⾜的痛点。
核⼼特性:
🔹 基于 WebQA 的知识检索
🔹 多轮对话式问答
🔹 强化学习优化
🔹 分布式训练⽀持
🔹 实时性能评估
这是⼀个完整的 Prompt 优化训练案例,使⽤ APO(Asynchronous Prompt Optimization,异步提示优化) 算法来训练⼀个智能会议室预订Agent。该案例展示了如何使⽤ Agent-Lightning 框架,通过⾃动化⽅式优化 AI Agent 的 Prompt 模板,⽽⾮微调模型参数。
核⼼特性:
🔹 智能决策:使⽤ LLM 进⾏会议室选择决策
🔹 函数调⽤:⽀持⼯具调⽤模式查询会议室可⽤性
🔹 ⾃动评分:使⽤ LLM Judge 对选择结果进⾏⾃动化评估
🔹 可训练:集成 Agent-Lightning 框架,⽀持通过 APO 算法优化提示模板
🔹 完整追踪:使⽤ AgentOps 进⾏执⾏轨迹追踪和调试
Single Agent 实战(4个案例)
🔹 Search Agent (搜索智能体):基于 AWorld 框架实现了⼀个智能搜索助⼿,能够⾃动选择最合适的搜索引擎(维基百科、DuckDuckGo、Google、百度)来获取信息,并⽣成综合分析报告。
🔹 Analyst Agent (分析智能体):一个基于 AWorld 框架构建的专业数据分析师智能体案例,展示了如何创建⼀个具备商业洞察能⼒的 AI 智能体来解决真实的业务问题。
🔹 本地⼯具 Agent (获取时间|计数器):这个案例展示了如何在 AWorld 框架中创建和使⽤⾃定义⼯具。
🔹 多⼯具协作 Agent 这是⼀个基于 AWorld 框架构建的多功能研究助⼿ Agent,专⻔⽤于市场调研和⽂档分析。案例展示了如何创建⼀个具备多种⼯具能⼒的智能体,能够处理复杂的⽂档分析任务。
VisionRAG Pro 是⼀个基于 UltraRAG 2.0 框架构建的智能视觉理解系统,专⻔⽤于图像理解、视觉问答、图表分析和⽂档解析等复杂的多模态任务。
该系统采⽤迭代式深度分析和智能路由决策机制,通过多轮推理实现对视觉内容的精准理解和智能问答:
🔹 检索增强视觉理解
上下⽂感知检索 - 基于分析问题动态检索相关知识
多模态知识融合 - 结合检索信息增强视觉理解能⼒
渐进式知识积累 - 每轮分析都会积累更深层的理解
🔹 ⾼效流程控制
声明式 Pipeline - YAML 配置实现复杂推理逻辑
并⾏处理优化 - ⽀持多模态数据的⾼效处理
模块化可扩展 - 新功能可⽆缝集成到现有流程
本节课带你从零开始搭建一个自定义 VRAG 系统,覆盖了从文档语料库准备、ColQwen2 嵌入向量生成、索引数据库构建,到 FastAPI 服务部署与 Streamlit 可视化界面搭建的全流程实战。
🔹 文档预处理与图片提取:将 PDF 高分辨率转图,构建图像语料库
🔹 ColQwen2 嵌入测试与索引构建:ImageNode 对象生成与保存
🔹 搜索引擎测试与 API 部署:FastAPI 启动参数与知识库绑定
🔹 VLM 推理服务部署:基于 Qwen2.5-VL-7B-VRAG 实现多模态推理
🔹 Web 可视化界面:Streamlit 前端展示与交互
通过本课,你将学会如何将多模态 Embedding 技术与检索增强生成 RAG 结合,构建可扩展、可定制的智能多模态检索问答系统。
本节课程带你完整走一遍 VRAG-RL 强化学习实战流程,从环境配置、搜索引擎与奖励模型服务启动,到执行训练脚本与参数配置,全流程剖析每一个关键步骤。
课程中使用 Qwen2.5-VL-3B-Instruct 多模态模型,结合 GRPO 策略优化,带你掌握强化学习在 RAG 场景中的实战应用。
🔹 Step1: Conda环境与依赖配置
🔹 Step2: 启动搜索引擎服务
🔹 Step3: 启动奖励模型服务
🔹 Step4: 执行训练脚本(含参数详细解读)
适合对象:AI算法工程师、科研人员、以及希望深入理解强化学习 + RAG 技术落地的学习者。
课程目录
- 阿里AgentEvolver:自提问×自导航×自归因,让 LLM Agent 高效“自进化” (9:29)
- 【会员专享】AgentEvolver 强化学习+LLM Agent:Self-Questioning 让智能体自己造训练集|多智能体/工具调用都能用 逆向任务生成 (21:38)
- 【会员专享】Agent强化学习训练提效:Self-Navigating 经验驱动探索与隐式经验学习 (15:10)
- 【会员专享】长程任务RL的“信用分配”怎么破?从“结果奖励”到“过程奖励” Self-Attributing把稀疏奖励变密集 (18:09)
- 【会员专享】AgentEvolver实战:AppWorld 环境 + GRPO 跑通「Agent自进化训练」全流程(安装/启动/配置)AI Agent (23:48)
- 微软Agent Lightning框架概览 (2:16)
- 统一数据接口:让AI Agent执行与强化学习训练无缝衔接 (6:54)
- 马尔可夫决策过程(MDP)详解:AI Agent与RL训练的理论基石 (8:22)
- LightningRL详解:将多轮Agent训练转化为单轮RL任务 (8:18)
- RL训练与Agent执行分离:AI Agent优化的新范式 (8:39)
- Agent Lightning分布式训练架构设计模式 (7:17)
- 四个典型AI Agent案例:Calc-X数学、Spider SQL、APO提示优化、RAG检索增强 (4:11)
- 【会员专享】用Agent Lightning框架打造可自我优化的SQL Agent (11:06)
- 【会员专享】SQL Agent 多GPU+Ray分布式:Agent Lightning强化学习训练实战 (9:23)
- 【会员专享】SQL Agent 源码解析 (10:27)
- 智能计算Agent项目概述|AutoGen + MCP + 强化学习 + Qwen大模型 (6:58)
- 【会员专享】手把手教你搭建智能计算Agent|从环境配置到模型推理一步到位|强化学习算法+全流程实操 (21:33)
- 【会员专享】RAG Agent RL实战指南(上):数据准备、模型下载与知识库构建 (16:07)
- 【会员专享】RAG Agent RL实战指南(下):从0到1部署检索服务,启动分布式强化学习训练 (20:39)
- 【会员专享】RAG Agent RL源码深度解析|从数据到推理的源码级拆解与实现 (29:14)
- 【会员专享】APO实战 Agent-Lightning 提示词自动优化:智能会议室预订Agent (43:53)
- 【会员专享】APO算法 会议室预订Agent案例 核心源码讲解:数据流、Beam Search、LLM Judge (18:56)
- VRAG-RL研究背景详解 (7:14)
- VRAG-RL方法论全拆解:多专家采样 × 细粒度奖励 (24:19)
- VRAG项目全流程解析:构建视觉增强问答系统(Agent+RAG+Qwen2.5) (18:59)
- 【会员专享】从零构建自定义多模态VRAG Agent助手|ColQwen2 嵌入+FastAPI 部署+Streamlit 可视化 全流程实战 (16:32)
- 【会员专享】本地知识库+开源框架(Ollama/Qwen/LlamaIndex)实战教程|多模态RAG检索增强生成 训练数据集构建全流程 (23:14)
- 【会员专享】强化学习实战 VRAG-RL全流程:基于Qwen2.5-VL和GRPO实现强化学习在多模态RAG中的应用 (10:47)
- 【会员专享】VRAG项目架构全解析 多模态RAG与强化学习智能体的系统设计与实现 (10:07)
- 【会员专享】VRAG-RL核心源码精讲|多模态检索增强生成与多步推理实现原理|从0到1构建多模态视觉RAG Agent系统 (LlamaIndex/Ollama) (12:37)
- 【会员专享】源码解析:Chain-of-Thought 数据生成 pipeline (13:51)
- 【会员专享】源码解析:基于LlamaIndex的索引构建与批量嵌入生成 (4:01)
- 【会员专享】源码解析:文本与图像向量化生成 (7:14)
- 【会员专享】源码解析:文本与图像向量检索 (5:52)