🌟 欢迎订阅 TGLTommy 会员课程,这是一套面向长期学习者的会员专享内容。课程采用按月订阅制,围绕不同主题持续更新,帮助你不断跟进最新技术、最新案例与最新实践。


🎯 订阅期间,你可以持续获取:
✅ 已上线的全部会员课程内容
✅ 后续新增专题与更新内容
✅ 会员专属课程资料
✅ 会员专属学习交流群(仅用作会员交流,与精品课程专享 AI 技术学习圈不同)

*本课程不设每月固定更新频次,具体更新将根据课程专题、项目实践和内容规划安排推进。你可以根据自己的学习需求和学习进度进行订阅~


🔔 如需通过淘宝或微信进行支付,请点此查看《微信小店/淘宝购买指引


本节课带你做一个智能电商客服 Demo

Skill = 知识模块(退款政策 / 产品 FAQ / 故障排查),按需加载,不再堆 Prompt

MCP = 执行工具(查订单/检查支付/执行退款/创建工单/对接CRM),让 Agent 真的能办事

实战覆盖 3 个高频场景:

🔹 退款闭环:政策判断 → 查单 → 资格判断 → 退款 → 工单记录

🔹 产品咨询:多 Skill 动态选择,快速给推荐与对比

🔹 故障排查+查单跨域协作:并行工具调用,合并结果给可执行方案

🔹 开发用 stdio,生产用 HTTP 的部署形态怎么选。



本期带你从0到1跑通 AgentEvolverAppWorld 实战:一个让 Agent 能“自己教自己”的自进化训练框架(Self-Questioning / Self-Navigating / Self-Attributing)。

你将学到:

🔹 AgentEvolver 三大核心机制到底在解决什么问题(自动生成任务 / 失败经验学习 / 步骤级奖励归因)

🔹 AppWorld 是什么、为什么适合作为入门环境(Python REPL + 457 个可调用 API + 多步骤任务)

🔹 最小化训练示例:只用环境内置数据集做基础 GRPO 训练(先把流程跑通)

🔹 环境服务如何启动、如何用 curl 验证服务正常

🔹 配置文件 basic.yaml 的关键点:禁用经验管理 ReMe、禁用 ADCA-GRPO,自顶向下理解训练入口 



本系列课程将带你深入理解 Agent Lightning —— 微软研究院提出的零代码强化学习(RL)优化 AI Agent 的工业级方案。

本节课程重点讲解 Spider SQL Agent

🔹 多轮交互式 SQL 生成与验证

🔹 基于奖励信号的强化学习优化

🔹 LangGraph 状态管理 + Agent Lightning 强化学习框架

🔹 Spider 数据集驱动的 SQL 查询优化

通过本节学习,你将完整掌握 从环境搭建、数据准备、Agent 实现、提示词策略、训练框架到RL优化 的全流程,为构建智能 SQL Agent 提供实战参考。



本节课程带你全面解析 智能计算 Agent 项目 Calc-X,一个通过 AutoGenAgentLightning 框架 无缝集成的数学计算 AI Agent 实战案例。

核心亮点包括:

🔹 AutoGen 多智能体对话系统 的应用与扩展

🔹 AgentLightning 框架 + vLLM 高性能推理服务器 的集成

🔹 MCP (Model Context Protocol) 工具调用与计算器服务器实践

🔹 强化学习 (RL) 在智能 Agent 训练中的奖励优化流程

通过本课程,你将学习如何 构建、训练与优化一个可执行数学计算任务的 AI Agent,并深入理解 多智能体协作 + 工具调用 + RL 奖励反馈 的完整闭环。



本项⽬基于 Agent Lightning 框架实现了⼀个⽀持检索增强⽣成(RAG)的智能 Agent 系统。

该系统通过 WebQA 知识库检索相关信息来回答⽤户问题,并采⽤强化学习进⾏优化训练。主要解决了传统 RAG 系统答案质量不稳定、检索相关性不⾜的痛点。

核⼼特性:

🔹 基于 WebQA 的知识检索

🔹 多轮对话式问答

🔹 强化学习优化

🔹 分布式训练⽀持

🔹 实时性能评估



这是⼀个完整的 Prompt 优化训练案例,使⽤ APOAsynchronous Prompt Optimization,异步提示优化) 算法来训练⼀个智能会议室预订Agent。该案例展示了如何使⽤ Agent-Lightning 框架,通过⾃动化⽅式优化 AI AgentPrompt 模板,⽽⾮微调模型参数。

核⼼特性:

🔹 智能决策:使⽤ LLM 进⾏会议室选择决策

🔹 函数调⽤:⽀持⼯具调⽤模式查询会议室可⽤性

🔹 ⾃动评分:使⽤ LLM Judge 对选择结果进⾏⾃动化评估

🔹 可训练:集成 Agent-Lightning 框架,⽀持通过 APO 算法优化提示模板

🔹 完整追踪:使⽤ AgentOps 进⾏执⾏轨迹追踪和调试



Single Agent 实战(4个案例)

🔹 Search Agent (搜索智能体):基于 AWorld 框架实现了⼀个智能搜索助⼿,能够⾃动选择最合适的搜索引擎(维基百科、DuckDuckGoGoogle、百度)来获取信息,并⽣成综合分析报告。

🔹 Analyst Agent (分析智能体):一个基于 AWorld 框架构建的专业数据分析师智能体案例,展示了如何创建⼀个具备商业洞察能⼒的 AI 智能体来解决真实的业务问题。

🔹 本地⼯具 Agent (获取时间|计数器):这个案例展示了如何在 AWorld 框架中创建和使⽤⾃定义⼯具。

🔹 多⼯具协作 Agent 这是⼀个基于 AWorld 框架构建的多功能研究助⼿ Agent,专⻔⽤于市场调研和⽂档分析。案例展示了如何创建⼀个具备多种⼯具能⼒的智能体,能够处理复杂的⽂档分析任务。



VisionRAG Pro 是⼀个基于 UltraRAG 2.0 框架构建的智能视觉理解系统,专⻔⽤于图像理解、视觉问答、图表分析和⽂档解析等复杂的多模态任务。

该系统采⽤迭代式深度分析和智能路由决策机制,通过多轮推理实现对视觉内容的精准理解和智能问答:

🔹 检索增强视觉理解

上下⽂感知检索 - 基于分析问题动态检索相关知识

多模态知识融合 - 结合检索信息增强视觉理解能⼒

渐进式知识积累 - 每轮分析都会积累更深层的理解

🔹 ⾼效流程控制

声明式 Pipeline - YAML 配置实现复杂推理逻辑

并⾏处理优化 - ⽀持多模态数据的⾼效处理

模块化可扩展 - 新功能可⽆缝集成到现有流程



本节课带你从零开始搭建一个自定义 VRAG 系统,覆盖了从文档语料库准备、ColQwen2 嵌入向量生成、索引数据库构建,到 FastAPI 服务部署与 Streamlit 可视化界面搭建的全流程实战。

🔹 文档预处理与图片提取:将 PDF 高分辨率转图,构建图像语料库

🔹 ColQwen2 嵌入测试与索引构建:ImageNode 对象生成与保存

🔹 搜索引擎测试与 API 部署:FastAPI 启动参数与知识库绑定

🔹 VLM 推理服务部署:基于 Qwen2.5-VL-7B-VRAG 实现多模态推理

🔹 Web 可视化界面:Streamlit 前端展示与交互

通过本课,你将学会如何将多模态 Embedding 技术与检索增强生成 RAG 结合,构建可扩展、可定制的智能多模态检索问答系统。



本节课程带你完整走一遍 VRAG-RL 强化学习实战流程,从环境配置、搜索引擎与奖励模型服务启动,到执行训练脚本与参数配置,全流程剖析每一个关键步骤。

课程中使用 Qwen2.5-VL-3B-Instruct 多模态模型,结合 GRPO 策略优化,带你掌握强化学习在 RAG 场景中的实战应用。

🔹 Step1: Conda环境与依赖配置

🔹 Step2: 启动搜索引擎服务

🔹 Step3: 启动奖励模型服务

🔹 Step4: 执行训练脚本(含参数详细解读)

适合对象:AI算法工程师、科研人员、以及希望深入理解强化学习 + RAG 技术落地的学习者。


课程目录

  TGLTommy 订阅会员专享课程(持续更新)
Available in days
days after you enroll
  Agent Skills 原理与实战
Available in days
days after you enroll
  阿里 AgentEvolver
Available in days
days after you enroll
  AWorld 多智能体框架
Available in days
days after you enroll
  清华UltraRAG 原理与实战
Available in days
days after you enroll
  微软Agent Lightning 理论与实战
Available in days
days after you enroll
  阿里多模态VRAG-RL 原理与实战
Available in days
days after you enroll

立即订阅 TGL Tommy 会员专享课程,开始 AI 前沿技术学习之旅!


🔔 如需通过淘宝或微信进行支付,请点此查看《微信小店/淘宝购买指引

解锁完整的大模型学习路径

如果你希望在某一个技术方向上进行更系统、完整的学习,欢迎继续学习我的精品课程。
会员专享课程更适合用于跟进 AI 前沿技术专题,通常学习周期更短、内容更聚焦,适合希望快速了解新技术、新模型和新方法的同学,帮助你持续保持对 AI 技术趋势的敏锐度。
精品课程则更侧重于围绕一个具体方向进行系统化学习,会从算法原理、核心论文、代码实践到项目应用进行完整梳理,帮助你建立更扎实的知识框架和实践能力。

一套系统化、生产级的 DeepSeek 大模型深度指南。



多模态大模型前沿算法及其应用,最新的研究成果与技术发展趋势。



大语言模型 LLM 和检索增强生成 RAG

理论与实战。


官方 Discord 学习社区

加入 TGLTommy AI Learning Hub 获取课程更新、免费学习资源、
以及会员与精品课程专属频道的加入指引。
如果你在购买课程过程中有任何疑问,可通过以下方式联系官方课程助理。
(请简单说明想了解的课程,我们会在工作时间内尽快回复。)

🔗 点此通过 Telegram 获取支持

💬 点此通过 微信 获取支持

关注 TGLTommy 官方账号