Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

前几天聊了个客户需求,客户基于 Dify 构建 RAG 服务,但是团队技术能力有限,RAG 的召回准确率不高,想找人帮忙调优。

刚好我们团队接手了这个案例,经过初步的模型调优、参数优化、Prompt 优化等操作,把准确率提升到90%以上。

在做 POC 的过程中,知识库文件太大,遇到了 Dify 向量空间已满的问题。

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

花费 59 美刀开通专业版做 POC,不是很有必要,索性本地部署 Dify,进行测试。

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

主要工具

Dify 是一款开源的大语言模型(LLM) 应用开发平台,拥有可视化的操作界面,结合了 AI 工作流、RAG 管道、代理功能、模型管理、可观察性功能等,可以快速从原型开发到生产。

Ollama 是一个开源的大模型管理工具,它提供了丰富的功能,包括模型的训练、部署、监控等。通过Ollama,你可以轻松地管理本地的大模型,提高模型的训练速度和部署效率。

Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括0.5B、1.5B、3B、7B、14B、32B 和72B。模型在预训练时使用了最新的大规模数据集,包含多达18 万亿个tokens,Qwen2.5 在自然语言理解、文本生成、编程能力、数学能力等方面都有显著提升。

Docker 是一种轻量级的虚拟化技术,同时是一个开源的应用容器运行环境搭建平台,可以让开发者以便捷方式打包应用到一个可移植的容器中,然后安装至任何运行Linux或Windows等系统的服务器上。

部署Dify

系统要求

在安装 Dify 之前,请确保您的机器满足以下最低系统要求:

CPU >= 2 Core

RAM >= 4GB

快速部署

通过 Docker compose 部署 Dify

克隆 Dify 源代码至本地

进入 docker 目录

复制一份环境变量

采用默认端口,一键启动

git clone https://github.com/langgenius/dify.git`  `cd dify/docker`  `cp .env.example .env`  `docker compose up -d

部署成功后如下图所示

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

Docker Desktop页面

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

说明

Windows 系统需要先安装 wsl,用于支持 Docker Desktop 的安装

部署Ollama

下载 Ollama

访问 https://ollama.ai/download,下载对应系统 Ollama 客户端,我是 Windows 系统,下载 Windows 版本,然后安装运行

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

部署Qwen2.5

下载 qwen2.5:7b 模型,ollama run qwen2.5:7b

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

部署Embedding模型

Embedding 是一种将词语或句子转换成数字向量的技术。它实际上是将高维、离散的输入数据(例如文本、图像、声音等)转换成低维、连续的向量表示的过程。

英文数据集选用 nomic-embed-textollama pull nomic-embed-text

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

中文数据集选用 bge-m3ollama pull bge-m3

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

使用Dify

设置账户

打开浏览器,输入 http://localhost/install ,设置管理员账号

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

配置模型

点击右上角头像,点击“设置”按钮

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

切换到模型供应商,进行模型配置,我这里已经配置好了,初次配置需要在页面下拉列表中找到“Ollama”

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

配置 Qwen2.5:7b 模型

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

配置 nomic-embed-text 模型

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

配置 bge-m3 模型

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

至此,整个配置流程结束,下一篇文章将介绍如何使用Dify搭建企业知识库聊天机器人

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

总结

本文详细介绍了如何将Dify本地私有化部署,并且接入Ollama部署本地大模型,构建本地RAG服务。希望能对大家有所帮助!


www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

www.zeeklog.com  - Windows平台上构建本地RAG服务:Dify + Ollama + Qwen2.5的强大组合实践!

Read more

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

摘   要 如今,随着卫星导航技术的飞速发展,位置信息服务已经融入到我们的日常生活中,导航目前被称为继移动互联网后第三大产业。卫星导航在维护国家的安全中也发挥着不可替代的作用。为了使导航系统不受干扰的影响,本文以北斗导航系统为平台,研究基于阵列天线的自适应抗干扰算法。 首先,文章就自适应抗干扰算法的原理和方法进行了系统介绍,并在MATLAB中建立阵列模型,对基于功率倒置算法的空域抗干扰算法和空时联合抗干扰算法进行性能仿真。然后根据系统的指标,确定了在FPGA中实现抗干扰算法的方案,包括数字下变频、权值计算、数据加权、数字上变频等模块。根据权值计算模块实现方式的不同,本文提供了两种抗干扰算法在FPGA中实现的方案:一种是基于FPGA嵌入式软核NIOS II的抗干扰实现,将权值计算的过程放在NIOS II软核中,用C语言进行实现;另一种是基于逻辑语言的抗干扰算法的实现,即用硬件描述语言Verilog HDL进行权值的计算。权值计算涉及到浮点数运算和Hermite矩阵求逆,本文给出了各模块的设计方法和仿真结果,并与MATLAB仿真结果进行对比。最后给出了两种实现方案的实测结果,表明两种实

FPGA 工程师到底有哪些方向?每个岗位都在干什么?一篇给你讲清楚

FPGA 工程师到底有哪些方向?每个岗位都在干什么?一篇给你讲清楚

很多人说“学 FPGA 就是写 Verilog”,但真正进了行业才发现—— FPGA 工程师并不是一个岗位,而是一整个岗位族群。 不同公司、不同项目,对 FPGA 工程师的要求差异非常大。 如果方向选错,可能学了半年发现岗位根本不对口。 这篇文章就系统地给你拆一拆: 👉 FPGA 工程师到底有哪些岗位? 👉 每个岗位具体干什么? 👉 需要掌握哪些能力? 👉 适合什么样的人? 一、FPGA 工程师整体岗位划分(先给结论) 从企业招聘角度来看,FPGA 岗位大致可以分为 6 类: 岗位方向关键词偏向FPGA 逻辑设计工程师Verilog / 时序 / 接口核心开发FPGA 算法 / 加速工程师图像 / AI / DSP算法落地FPGA 底层驱动工程师DDR / PCIe / SerDes硬件接口FPGA 系统应用工程师Linux + FPGA系统集成FPGA 验证 / 测试仿真 / 验证质量保障FPGA 技术支持 / FA客户 / 项目支持应用型

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw 多飞书机器人与多 Agent 团队实战复盘 这篇文章完整记录一次从单机安装到多机器人协作落地的真实过程: 包括 Windows 安装报错、Gateway 连通、模型切换、Feishu 配对、多 Agent 路由、身份错位修复,以及最终形成“产品-开发-测试-评审-文档-运维”团队。 一、目标与结果 这次实践的目标很明确: 1. 在 Windows 上稳定跑通 OpenClaw 2. 接入飞书机器人 3. 做到一个机器人对应一个 Agent 角色 4. 支持多模型并行(OpenAI + Ollama) 5. 最终形成可执行的多 Agent 团队 最终落地状态(已验证): * 渠道:Feishu 多账号在线 * 路由:按 accountId

宇树 G1 机器人开发入门:有线 & 无线连接完整指南

宇树 G1 机器人开发入门:有线 & 无线连接完整指南

适用读者:机器人二次开发者、科研人员 开发环境:Ubuntu 20.04(推荐) 机器人型号:Unitree G1 EDU+ 前言 宇树 G1 是一款面向科研与商业应用的高性能人形机器人,支持丰富的二次开发接口。在正式进行算法调试与功能开发之前,首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式:有线(网线直连) 与 无线(WiFi + SSH),并附上完整的配置流程,帮助开发者快速上手。 一、有线连接(推荐新手优先使用) 有线连接通过网线直接将开发电脑与 G1 机器人相连,具有延迟低、稳定性高、不依赖外部网络的优势,是新手入门和底层调试的首选方式。 1.1 前置条件 所需物品说明开发电脑推荐安装 Ubuntu 20.04,或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线(