2025,AI Agents技术栈解读出炉!

2025,AI Agents技术栈解读出炉!

2025新年伊始,今年将是“Agentic系统之年”,“2025将会出现真正Agent”,时不我待,请签收属于你的AI Agents技术栈综述。

理解AI Agents生态

尽管我们看到了大量关于Agent栈和市场的分类图,但我们往往不同意它们的分类方式,发现它们很少反映开发者实际使用的。在过去几个月中,随着在内存、工具使用、安全执行和部署方面的进步,Agent软件生态系统有了显著的发展,因此,能够真正落地的“Agent技术栈(agent stack)”应该是怎样尼?

AI Agents技术栈,被组织成三个关键层:Agent托管/服务、Agent框架,以及LLM模型和存储。

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

从LLM到LLM Agent

在2022年和2023年,我们看到了LLM框架和SDK的兴起,比如LangChain(2022年10月发布)和LlamaIndex(2022年11月发布)。同时,我们也看到了几个“标准”平台的建立,这些平台通过API消费LLMs以及自部署LLM推理(vLLM和Ollama)。

在2024年,我们看到了对AI“Agent”的兴趣急剧转变,更广泛地说,是对复合系统的兴趣。尽管“Agent”这个术语在AI中已经存在了几十年(特别是在强化学习中),但在后ChatGPT时代,“Agent”已经成为一个松散定义的术语,通常指的是被赋予输出动作(工具调用)并在自治设置中运行的LLM。从LLM到Agent所需的工具使用、自治执行和内存的结合,促使一个新的Agent栈发展。

Agent技术栈的独特之处

与基本的LLM聊天机器人相比,Agent是一个更复杂的工程挑战,因为它们需要状态管理(保留消息/事件历史记录,存储长期记忆,执行多个LLM调用在一个Agent循环中)和工具执行(安全执行LLM输出的动作并返回结果)。

因此,AI Agent栈与标准的LLM栈看起来非常不同。让我们从模型服务层开始,分解今天的AI Agent栈:

模型服务

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

AI Agent的核心是LLM。要使用LLM,模型需要通过推理引擎提供服务,通常运行在付费API服务后面。

OpenAI和Anthropic在基于封闭API的模型推理提供商中领先,拥有私有前沿模型。Together.AI、Fireworks和Groq是提供开放权重模型(例如Llama 3)背后的付费API的流行选项。在本地模型推理提供商中,我们最常见到vLLM领先于生产级GPU基础服务负载。SGLang是一个新兴项目,拥有类似的开发者受众。在业余爱好者(“AI爱好者”)中,Ollama和LM Studio是两个流行的选项,用于在您自己的计算机上运行模型(例如M系列Apple Macbooks)。

存储

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

存储是定义为有状态的Agent的基本构建块——Agent由持久状态定义,如他们的对话历史记录、记忆和外部数据源,他们用于RAG。像Chroma、Weaviate、Pinecone、Qdrant和Milvus这样的向量数据库很受欢迎,用于存储Agent的“外部记忆”,允许Agent利用数据源和对话历史记录,这些数据太大,无法放入上下文窗口。Postgres是一个自80年代以来就存在的传统数据库,现在也通过pgvector扩展支持向量搜索。基于Postgres的公司如Neon(无服务器Postgres)和Supabase也为Agent提供基于嵌入的搜索和存储。

工具和库

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

标准AI聊天机器人和AI Agent之间的一个主要区别是Agent调用“工具”(或“功能”)的能力。在大多数情况下,这种动作的机制是LLM生成结构化输出(例如JSON对象),指定要调用的函数和提供的参数。Agent工具执行的一个常见混淆点是,工具执行_不是_由LLM提供商本身完成的——LLM只选择要调用的工具和提供的参数。支持任意工具或任意参数输入工具的Agent服务必须使用沙箱(例如Modal、E2B)以确保安全执行。

Agent通过OpenAI定义的JSON模式调用工具——这意味着Agent和工具实际上可以跨不同框架兼容。Letta Agent可以调用LangChain、CrewAI和Composio工具,因为它们都是由相同的模式定义的。因此,对于常见工具,有一个不断增长的工具提供商生态系统。Composio是一个流行的通用工具库,还管理授权。Browserbase是一个专门用于网页浏览的专用工具的例子,Exa提供了一个专门用于搜索网络的专用工具。随着越来越多的Agent被构建,我们预计工具生态系统将增长,并提供现有新功能,如Agent的身份验证和访问控制。

Agent框架

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

Agent框架协调LLM调用并管理Agent状态。不同的框架将为以下方面有不同的设计:

管理Agent的状态:大多数框架引入了一些“序列化”状态的概念,允许Agent通过将序列化状态(例如JSON、字节)保存到文件中,在稍后的时间加载回相同的脚本——这包括状态如对话历史记录、Agent记忆和执行阶段。在Letta中,所有状态都由数据库支持(例如消息表、Agent状态表、内存块表),没有“序列化”的概念,因为Agent状态始终被持久化。这允许轻松查询Agent状态(例如,按日期查找过去的信息)。状态的表示和管理方式决定了Agent应用程序将如何随着更长的对话历史记录或更多的Agent数量进行扩展,以及如何灵活地访问或修改状态。

Agent的上下文窗口结构:每次调用LLM时,框架将“编译”Agent的状态到上下文窗口。不同的框架将以不同的方式将数据放入上下文窗口(例如指令、消息缓冲区等),这可能会改变性能。我们建议选择一个使上下文窗口透明的框架,因为这最终是您可以控制您的Agent行为的方式。

跨Agent通信(即多Agent):Llama Index通过消息队列让Agent通信,而CrewAI和AutoGen有明确的抽象器用于多Agent。Letta和LangGraph都支持Agent直接相互调用,这允许集中式(通过监督Agent)和跨Agent的分布式通信。大多数框架现在支持多Agent和单Agent,因为一个设计良好的单Agent系统应该使跨Agent协作易于实现。

内存方法:LLM的基本限制是它们有限的上下文窗口,这就需要管理随时间的记忆。一些框架内置了内存管理,而其他框架则期望开发者自己管理内存。CrewAI和AutoGen完全依赖基于RAG的内存,而phidata和Letta使用额外的技术,如自我编辑内存(来自MemGPT)和递归总结。Letta Agent自动配备了一套内存管理工具,允许Agent通过文本或数据搜索先前的消息,编写记忆,并编辑Agent自己的上下文窗口(您可以在这里阅读更多)。

支持开放模型:模型提供商实际上做了很多幕后技巧,让LLM以正确的格式生成文本(例如用于工具调用)——例如,当它们没有生成适当的工具参数时,重新采样LLM输出,或在提示中添加提示(例如“请输出JSON”)。支持开放模型需要框架处理这些挑战,所以一些框架限制对主要模型提供商的支持。

在今天构建Agent时,正确的框架选择取决于您的应用程序,例如您是否正在构建会话Agent或工作流程,您是否希望在笔记本或作为服务运行Agent,以及您对开放权重模型支持的要求。

我们预计框架之间的主要区别将出现在它们的部署工作流程中,状态/内存管理和工具执行的设计选择变得更加重要。

Agent托管和Agent服务

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

今天的大多数Agent框架都是为那些不存在于它们编写的Python脚本或Jupyter笔记本之外的Agent设计的。我们相信Agent的未来是将Agent视为一个_服务_,该服务被部署到本地或云基础设施上,可以通过REST API访问。就像OpenAI的ChatCompletion API成为与LLM服务交互的行业标准一样,我们预计最终会有一个赢家为Agent API。但还没有一个……。

部署Agent作为服务比部署LLM作为服务要复杂得多,因为状态管理和安全工具执行的问题。工具及其所需的依赖项和环境需求需要明确存储在数据库中,因为运行它们的环境需要由服务重新创建(这不是一个问题,当您的工具和Agent在同一个脚本中运行时)。应用程序可能需要运行数百万Agent,每个Agent都累积了越来越多的对话历史记录。当从原型转移到生产时,Agent状态不可避免地必须经历一个数据规范化过程,Agent交互必须由REST API定义。今天,这个过程通常是通过开发者编写自己的FastAPI和数据库代码来完成的,但我们预计随着Agent的成熟,这个功能将更多地嵌入到框架中。

结论

Agent技术栈仍然非常早期,我们对生态系统如何扩展和演变感到兴奋。对未来Agent技术栈发展你还有什么补充吗?

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

www.zeeklog.com  - 2025,AI Agents技术栈解读出炉!

Read more

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

摘   要 如今,随着卫星导航技术的飞速发展,位置信息服务已经融入到我们的日常生活中,导航目前被称为继移动互联网后第三大产业。卫星导航在维护国家的安全中也发挥着不可替代的作用。为了使导航系统不受干扰的影响,本文以北斗导航系统为平台,研究基于阵列天线的自适应抗干扰算法。 首先,文章就自适应抗干扰算法的原理和方法进行了系统介绍,并在MATLAB中建立阵列模型,对基于功率倒置算法的空域抗干扰算法和空时联合抗干扰算法进行性能仿真。然后根据系统的指标,确定了在FPGA中实现抗干扰算法的方案,包括数字下变频、权值计算、数据加权、数字上变频等模块。根据权值计算模块实现方式的不同,本文提供了两种抗干扰算法在FPGA中实现的方案:一种是基于FPGA嵌入式软核NIOS II的抗干扰实现,将权值计算的过程放在NIOS II软核中,用C语言进行实现;另一种是基于逻辑语言的抗干扰算法的实现,即用硬件描述语言Verilog HDL进行权值的计算。权值计算涉及到浮点数运算和Hermite矩阵求逆,本文给出了各模块的设计方法和仿真结果,并与MATLAB仿真结果进行对比。最后给出了两种实现方案的实测结果,表明两种实

FPGA 工程师到底有哪些方向?每个岗位都在干什么?一篇给你讲清楚

FPGA 工程师到底有哪些方向?每个岗位都在干什么?一篇给你讲清楚

很多人说“学 FPGA 就是写 Verilog”,但真正进了行业才发现—— FPGA 工程师并不是一个岗位,而是一整个岗位族群。 不同公司、不同项目,对 FPGA 工程师的要求差异非常大。 如果方向选错,可能学了半年发现岗位根本不对口。 这篇文章就系统地给你拆一拆: 👉 FPGA 工程师到底有哪些岗位? 👉 每个岗位具体干什么? 👉 需要掌握哪些能力? 👉 适合什么样的人? 一、FPGA 工程师整体岗位划分(先给结论) 从企业招聘角度来看,FPGA 岗位大致可以分为 6 类: 岗位方向关键词偏向FPGA 逻辑设计工程师Verilog / 时序 / 接口核心开发FPGA 算法 / 加速工程师图像 / AI / DSP算法落地FPGA 底层驱动工程师DDR / PCIe / SerDes硬件接口FPGA 系统应用工程师Linux + FPGA系统集成FPGA 验证 / 测试仿真 / 验证质量保障FPGA 技术支持 / FA客户 / 项目支持应用型

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw 多飞书机器人与多 Agent 团队实战复盘 这篇文章完整记录一次从单机安装到多机器人协作落地的真实过程: 包括 Windows 安装报错、Gateway 连通、模型切换、Feishu 配对、多 Agent 路由、身份错位修复,以及最终形成“产品-开发-测试-评审-文档-运维”团队。 一、目标与结果 这次实践的目标很明确: 1. 在 Windows 上稳定跑通 OpenClaw 2. 接入飞书机器人 3. 做到一个机器人对应一个 Agent 角色 4. 支持多模型并行(OpenAI + Ollama) 5. 最终形成可执行的多 Agent 团队 最终落地状态(已验证): * 渠道:Feishu 多账号在线 * 路由:按 accountId

宇树 G1 机器人开发入门:有线 & 无线连接完整指南

宇树 G1 机器人开发入门:有线 & 无线连接完整指南

适用读者:机器人二次开发者、科研人员 开发环境:Ubuntu 20.04(推荐) 机器人型号:Unitree G1 EDU+ 前言 宇树 G1 是一款面向科研与商业应用的高性能人形机器人,支持丰富的二次开发接口。在正式进行算法调试与功能开发之前,首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式:有线(网线直连) 与 无线(WiFi + SSH),并附上完整的配置流程,帮助开发者快速上手。 一、有线连接(推荐新手优先使用) 有线连接通过网线直接将开发电脑与 G1 机器人相连,具有延迟低、稳定性高、不依赖外部网络的优势,是新手入门和底层调试的首选方式。 1.1 前置条件 所需物品说明开发电脑推荐安装 Ubuntu 20.04,或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线(