大模型

RAG、知识库与LLM全解析：一文速通指南

优质文章学习记录

06 Feb 2025 — 9 min read

检索增强生成（Retrieval Augmented Generation，RAG）是一种强大的工具，它通过将企业外部知识整合到生成过程中，增强了大语言模型（LLM）的性能。

RAG本质上是通过工程化手段，解决LLM知识更新困难的问题。其核心手段是利用外挂于LLM的知识数据库（通常使用向量数据库）存储未在训练数据集中出现的新数据、领域数据等。通常而言，RAG将知识问答分成三个阶段：索引、知识检索和基于内容的问答。

企业中使用RAG的主要目的是增强大模型，为大模型提供能力提升，目前主要是以下几方面：

a) 减少大模型在回答问题时的幻觉问题
b) 让大模型的回答可以附带相关的来源和参考
c) 消除使用元数据注释文档的需要

RAG的7大关键组成部分

接下来我们一起来看看组成RAG的7大关键组成部分。

第一、自定义知识库（Custom Knowledge）

定制知识库是指一系列紧密关联且始终保持更新的知识集合，它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态（比如：MySQL），也可以表现为一套非结构化的文档体系（比如：文件、图图片、音频、视频等），甚至可能是两者兼具的综合形式。

第二、分块处理（Chunking）

分块技术是指将大规模的输入文本有策略地拆解为若干个较小、更易管理的片段（Chunk）的过程。这一过程旨在确保所有文本内容均能适应嵌入模型所限定的输入尺寸，同时也有助于显著提升检索效率。

实施一种明智且高效的分块策略，在优化知识处理流程方面具有关键作用，能够极大地增强您的 RAG 系统的性能与响应能力。

第三、嵌入模型（Embedding Model）

一种将多模态数据（文本、图片、音频等）表示为数值向量的技术，可以输入到机器学习模型中。

嵌入模型负责将多模态数据转换成这些向量。

第四、向量数据库（ Vector Databases）

一系列预先计算的文本数据向量表示，用于快速检索和相似性搜索，具有SQL CRUD 操作、元数据过滤和水平扩展等功能。

第五、用户聊天界面（User Chat Interface）

一个用户友好的界面，允许用户与 RAG 系统互动，提供输入查询并接收输出。

查询转换为嵌入向量，用于从向量数据库检索相关上下文知识！

第六、查询引擎（Query Engine）

查询引擎获取查询字符串，使用它来获取相关上下文，然后将两者一起作为提示词发送给 LLM 以生成最终的自然语言响应。这里使用的 LLM 是Llama-3。

Llama 3是Meta股份有限公司开发的一系列模型，是最先进的新型模型，有8B和70B参数大小（预先训练或指导调整）。Llama3模型是用15T+（超过15万亿）tokens和800亿至700亿参数进行预训练和微调的，这使其成为强大的开源模型之一。这是对Llama2模型的高度改进。

它在本地运行，这要归功于 Ollama。最终响应将在用户界面上显示。

第七、提示词模板（Prompt Template）

为 RAG 系统生成合适提示词的过程，可以是用户查询和自定义知识库的组合。

这作为输入给 LLM，生成最终的回复。

探索合适的场景

企业知识管理领域有句话，叫“80%的知识管理项目通常会失败”。失败的主要原因，通常会卡在虽然建好了知识库，但知识无法与业务应用结合，产生实际业务价值。一句话总结，知识库和业务场景，是割裂的。

RAG的方法是首先确定应用场景，如搜索、问答、推荐、考试等，然后根据这些场景确定需要的知识，接着考虑如何收集、处理和运营这些知识。这种方法从一开始就确保了知识管理是以业务和价值为导向。因此，相关的业务部门可以更容易地从搜索、问答、推荐等场景出发来思考问题和提出需求，而不必先理解知识管理的操作，然后再考虑如何将其与自己的业务结合应用。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

摘要如今，随着卫星导航技术的飞速发展，位置信息服务已经融入到我们的日常生活中，导航目前被称为继移动互联网后第三大产业。卫星导航在维护国家的安全中也发挥着不可替代的作用。为了使导航系统不受干扰的影响，本文以北斗导航系统为平台，研究基于阵列天线的自适应抗干扰算法。首先，文章就自适应抗干扰算法的原理和方法进行了系统介绍，并在MATLAB中建立阵列模型，对基于功率倒置算法的空域抗干扰算法和空时联合抗干扰算法进行性能仿真。然后根据系统的指标，确定了在FPGA中实现抗干扰算法的方案，包括数字下变频、权值计算、数据加权、数字上变频等模块。根据权值计算模块实现方式的不同，本文提供了两种抗干扰算法在FPGA中实现的方案：一种是基于FPGA嵌入式软核NIOS II的抗干扰实现，将权值计算的过程放在NIOS II软核中，用C语言进行实现；另一种是基于逻辑语言的抗干扰算法的实现，即用硬件描述语言Verilog HDL进行权值的计算。权值计算涉及到浮点数运算和Hermite矩阵求逆，本文给出了各模块的设计方法和仿真结果，并与MATLAB仿真结果进行对比。最后给出了两种实现方案的实测结果，表明两种实

FPGA 工程师到底有哪些方向？每个岗位都在干什么？一篇给你讲清楚

很多人说“学 FPGA 就是写 Verilog”，但真正进了行业才发现—— FPGA 工程师并不是一个岗位，而是一整个岗位族群。不同公司、不同项目，对 FPGA 工程师的要求差异非常大。如果方向选错，可能学了半年发现岗位根本不对口。这篇文章就系统地给你拆一拆： 👉 FPGA 工程师到底有哪些岗位？ 👉 每个岗位具体干什么？ 👉 需要掌握哪些能力？ 👉 适合什么样的人？一、FPGA 工程师整体岗位划分（先给结论）从企业招聘角度来看，FPGA 岗位大致可以分为 6 类：岗位方向关键词偏向FPGA 逻辑设计工程师Verilog / 时序 / 接口核心开发FPGA 算法 / 加速工程师图像 / AI / DSP算法落地FPGA 底层驱动工程师DDR / PCIe / SerDes硬件接口FPGA 系统应用工程师Linux + FPGA系统集成FPGA 验证 / 测试仿真 / 验证质量保障FPGA 技术支持 / FA客户 / 项目支持应用型

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw 多飞书机器人与多 Agent 团队实战复盘这篇文章完整记录一次从单机安装到多机器人协作落地的真实过程：包括 Windows 安装报错、Gateway 连通、模型切换、Feishu 配对、多 Agent 路由、身份错位修复，以及最终形成“产品-开发-测试-评审-文档-运维”团队。一、目标与结果这次实践的目标很明确： 1. 在 Windows 上稳定跑通 OpenClaw 2. 接入飞书机器人 3. 做到一个机器人对应一个 Agent 角色 4. 支持多模型并行（OpenAI + Ollama） 5. 最终形成可执行的多 Agent 团队最终落地状态（已验证）： * 渠道：Feishu 多账号在线 * 路由：按 accountId

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

适用读者：机器人二次开发者、科研人员开发环境：Ubuntu 20.04（推荐）机器人型号：Unitree G1 EDU+ 前言宇树 G1 是一款面向科研与商业应用的高性能人形机器人，支持丰富的二次开发接口。在正式进行算法调试与功能开发之前，首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式：有线（网线直连）与无线（WiFi + SSH），并附上完整的配置流程，帮助开发者快速上手。一、有线连接（推荐新手优先使用）有线连接通过网线直接将开发电脑与 G1 机器人相连，具有延迟低、稳定性高、不依赖外部网络的优势，是新手入门和底层调试的首选方式。 1.1 前置条件所需物品说明开发电脑推荐安装 Ubuntu 20.04，或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线（