大模型

LLM｜利用Ollama搭建个人本地知识库

优质文章学习记录

06 Feb 2025 — 10 min read

最近一直想基于RAG（检索增强生成，Retrieval-Augmented Generation）和大语言模型（Large Language Model, LLM）技术搭建一套属于自己的个人知识库，以为会涉及到诸多复杂的流程，包括模型调用、界面开发等。今天找到了一点资料，发现特别简单，花了几分钟实现了一下，主要用到了三个软件：

Ollama

Docker

AnythingLLM

1 基本资料介绍

大预言模型已经很常见了，包括ChatGPT、Claude、通义千问等等，此处就不再过多介绍了，这里主要介绍用到的几个软件和基本技术。

1.1 RAG

检索增强生成（RAG）是指对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型（LLM）用海量数据进行训练，使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上，RAG 将其扩展为能访问特定领域或组织的内部知识库，所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法，让它在各种情境下都能保持相关性、准确性和实用性。

与RAG并生的另一种技术叫监督式微调（SFT），是将LLM模型注入新的知识库并将模型本身进行训练以获得所需要的结果，需要有一定的硬件设备。两种技术并不矛盾，其实互相结合才是最好的解决方案。本文不对此过多介绍，具体可网上搜索相关概念。

1.2 Ollama

ollama是一个开源的大型语言模型服务工具，它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。 Ollama 的主要功能是在Docker容器内部署和管理大型语言模型（LLM），使得用户能够快速地在本地运行这些模型。 Ollama官网地址：https://ollama.com/

1.3 Docker

Docker 是一个软件平台，让您可以快速构建、测试和部署应用程序。Docker 将软件打包成名为容器的标准化单元，这些单元具有运行软件所需的所有功能，包括库、系统工具、代码和运行时。使用 Docker，可以将应用程序快速部署和扩展到任何环境中。

Docker官网地址：https://www.docker.com/

1.4 AnythingLLM

AnythingLLM是由Mintplex Labs Inc.开发的一个全栈应用程序，是一款高效、可定制、开源的企业级文档聊天机器人解决方案。它能够将任何文档、资源或内容片段转化为大语言模型在聊天中可以利用的相关上下文。 AnythingLLM支持几乎所有的主流大模型和多种文档类型，可定制化，而且安装和设置简单。

2 实现流程

2.1 安装Ollama

下载Ollama（网址：https://ollama.com/download）

下载直接一路Next即可

在Ollama官网下载基准大预言模型，点击Models-Filter by name。我这里用的qwen2

我这里选择了qwen2:7b模型，大小为4.4G。

双击图标，运行ollama。之后，打开终端，windows电脑：win+cmd；mac电脑：图标终端。粘贴刚刚复制的命令，回会车，即可自动下载模型（可能网络会有些问题）

进一步，直接可以对话提问了。（不要关闭）

2.2 安装Docker

下载Docker，网站：https://www.docker.com/

直接安装即可，非常简单

双击运行

2.3 安装AnythingLLM

其实，AnythingLLM也有自己的界面，这里我们直接在Docker里面安装。

ctrl+K或command+K，搜索AnythingLLM，并点击Pull，自动开始下载

下载好后，点击左侧栏目的Images，在右侧的镜像列表中点击AnythingLLM，再点击run启动镜像。

配置端口号，随便输入个4位数即可（不要与现有的容器名和端口冲突即可）

启动服务，跳转到浏览器

选择Ollama，选择刚刚下载好的qwen2:7b模型，max token自己任取

按如下选择，其他保持默认即可

这里是选择的配置，其中：Embedding Preference是Embedding偏好的模型，这里默认选择的是AnythingLLM Embedder；Vector Database向量库默认选择LanceDB

下一步输入邮件地址和用途，输入工作区名称，进入主页面

点击左侧的“个人知识库”，即可开始对话。当然在这之前，我们先上传个人知识库

点击上传按钮

上传文档，移动到右侧工作区，并将文档向量化（本地执行），稍等一下即成功。

回到主页面，选择“个人知识库“，开始对话。可以看到，结果还是很准的。

可在设置里面调整工作区名称、头像、文档相似性阈值等信息

3 结论

本期属于不务正业，基于RAG的个人本地知识库搭建还是很简单的，后面尝试把专业相关的知识注入进去，方便自己的个人知识库检索。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

👉4.大模型落地应用案例PPT👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（全套教程文末领取哈）

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

摘要如今，随着卫星导航技术的飞速发展，位置信息服务已经融入到我们的日常生活中，导航目前被称为继移动互联网后第三大产业。卫星导航在维护国家的安全中也发挥着不可替代的作用。为了使导航系统不受干扰的影响，本文以北斗导航系统为平台，研究基于阵列天线的自适应抗干扰算法。首先，文章就自适应抗干扰算法的原理和方法进行了系统介绍，并在MATLAB中建立阵列模型，对基于功率倒置算法的空域抗干扰算法和空时联合抗干扰算法进行性能仿真。然后根据系统的指标，确定了在FPGA中实现抗干扰算法的方案，包括数字下变频、权值计算、数据加权、数字上变频等模块。根据权值计算模块实现方式的不同，本文提供了两种抗干扰算法在FPGA中实现的方案：一种是基于FPGA嵌入式软核NIOS II的抗干扰实现，将权值计算的过程放在NIOS II软核中，用C语言进行实现；另一种是基于逻辑语言的抗干扰算法的实现，即用硬件描述语言Verilog HDL进行权值的计算。权值计算涉及到浮点数运算和Hermite矩阵求逆，本文给出了各模块的设计方法和仿真结果，并与MATLAB仿真结果进行对比。最后给出了两种实现方案的实测结果，表明两种实

FPGA 工程师到底有哪些方向？每个岗位都在干什么？一篇给你讲清楚

很多人说“学 FPGA 就是写 Verilog”，但真正进了行业才发现—— FPGA 工程师并不是一个岗位，而是一整个岗位族群。不同公司、不同项目，对 FPGA 工程师的要求差异非常大。如果方向选错，可能学了半年发现岗位根本不对口。这篇文章就系统地给你拆一拆： 👉 FPGA 工程师到底有哪些岗位？ 👉 每个岗位具体干什么？ 👉 需要掌握哪些能力？ 👉 适合什么样的人？一、FPGA 工程师整体岗位划分（先给结论）从企业招聘角度来看，FPGA 岗位大致可以分为 6 类：岗位方向关键词偏向FPGA 逻辑设计工程师Verilog / 时序 / 接口核心开发FPGA 算法 / 加速工程师图像 / AI / DSP算法落地FPGA 底层驱动工程师DDR / PCIe / SerDes硬件接口FPGA 系统应用工程师Linux + FPGA系统集成FPGA 验证 / 测试仿真 / 验证质量保障FPGA 技术支持 / FA客户 / 项目支持应用型

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw 多飞书机器人与多 Agent 团队实战复盘这篇文章完整记录一次从单机安装到多机器人协作落地的真实过程：包括 Windows 安装报错、Gateway 连通、模型切换、Feishu 配对、多 Agent 路由、身份错位修复，以及最终形成“产品-开发-测试-评审-文档-运维”团队。一、目标与结果这次实践的目标很明确： 1. 在 Windows 上稳定跑通 OpenClaw 2. 接入飞书机器人 3. 做到一个机器人对应一个 Agent 角色 4. 支持多模型并行（OpenAI + Ollama） 5. 最终形成可执行的多 Agent 团队最终落地状态（已验证）： * 渠道：Feishu 多账号在线 * 路由：按 accountId

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

适用读者：机器人二次开发者、科研人员开发环境：Ubuntu 20.04（推荐）机器人型号：Unitree G1 EDU+ 前言宇树 G1 是一款面向科研与商业应用的高性能人形机器人，支持丰富的二次开发接口。在正式进行算法调试与功能开发之前，首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式：有线（网线直连）与无线（WiFi + SSH），并附上完整的配置流程，帮助开发者快速上手。一、有线连接（推荐新手优先使用）有线连接通过网线直接将开发电脑与 G1 机器人相连，具有延迟低、稳定性高、不依赖外部网络的优势，是新手入门和底层调试的首选方式。 1.1 前置条件所需物品说明开发电脑推荐安装 Ubuntu 20.04，或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线（