本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

使用Huggingface上的开源医疗数据集,借助 RAGFlow 搭建自己的本地医疗问诊助手。

纯本地构建:本地知识库+本地向量化模型+本地大模型
medical_QA+shaw/dmeta-embedding-zh+qwen2:7b

原理:RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。它的作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

ragflow最大特点:不同的解析方法,支持丰富的文件类型,如Word、PPT、excel表格、csv/txt、图片、PDF、结构化数据、网页等
具体可以在本地部署成功后,在解析方法中查看

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

接下来,开始进入使用阶段,起舞··**

一 使用自带的 WSL 安装 Ubuntu-22.04 系统**

什么是WSL?WSL(Windows Subsystem for Linux)是微软开发的一项技术,允许用户在Windows系统中直接运行完整的Linux环境,无需虚拟机。通过操作系统级虚拟化,WSL将Linux子系统无缝嵌入Windows,提供原生Linux命令行工具、软件包管理器及应用程序支持。它具有轻量化、文件系统集成、良好的交互性及开发效率提升等优点,消除了Windows与Linux之间的隔阂,尤其适合开发者和需在Windows平台上使用Linux工具的用户。

1 启用window子系统及虚拟化

控制面板->程序和功能->启用或关闭window功能 或者:
win + r 键入 OptionalFeatures,直接打开
提示:winver查看 windows 系统版本:
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

最后,重启电脑后生效

2 将wsl,升级为wsl2

参考文章:zhuanlan.zhihu.com/p/704855705
说明:win默认系统自带了wsl,直接管理员身份打开cmd执行相关操作

**相关命令:
**

wsl --update #升级到最新版本(wsl2)``wsl --list --online # 查看所有可用的发行版``wsl --install -d Ubuntu-22.04 # 安装 Ubuntu-22.04 系统``wsl -l -v # 显示当前安装了哪些系统``wsl --set-default-version 2 #设置wsl默认版本为wsl2``wsl.exe --set-version Ubuntu-22.04 2 #设置Ubuntu-22.04为 wsl2``wsl.exe --set-version Ubuntu-22.04 1 #设置为wsl1``wsl -d Ubuntu-22.04 #登录到Ubuntu环境
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

建议:wsl升级并设置默认版本为wsl2

3 启动操作安装的linux
使用 wsl:在 cmd(或powershell)输入 wsl(或者:wsl -d Ubuntu-22.04)
cat /etc/os-release #查看 Linux 的版本

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

设置时区命令:

timedatectl # 检查当前设置的时区  
sudo timedatectl set-timezone Asia/Shanghai # 将时区设置为中国标准时间  
timedatectl # 确保时区已经正确设置

操作 Linux 文件:
windows 文件资源管理器-> Linux 的标志,点击 Linux 就可以

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

二 安装win桌面版docker

win桌面版 地址:
www.docker.com/products/docker-desktop/
下载完之后,按照提示,一直点就行了哈

提示:因为安装完成后镜像很大(44G左右),默认会安装在C盘,建议更改到其他空闲盘

更改方法:设置–>Resourses

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

以下本项目用不到,可以忽略,因为docker用的是win桌面版docker

linux (学习在ubuntu上安装docker和docker compose)

安装docker :
https://zhuanlan.zhihu.com/p/651148141

安装 docker compose:

curl -SL https://github.com/docker/compose/releases/download/v2.29.6/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose #下载 docker-compose程序包``sudo chmod +x /usr/local/bin/docker-compose #添加可执行权限``docker-compose -v #查看版本

三 部署启动ragflow

以下命令在git bash 中执行

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

ragflow仓库:
github.com/infiniflow/ragflow/blob/main/README_zh.md

软硬件要求:硬件:CPU ≥ 4 核 ; 内存≥ 16 GB; 磁盘空间 ≥ 50 GB; 软件:Docker版本 ≥ 24.0.0 ;Docker Compose 版本 ≥ v2.26.1



#查看版本docker -vdocker compose version




www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

启动部署服务器:

#1 克隆仓库``git clone https://github.com/infiniflow/ragflow.git``   ``#2 使用Docker镜像启动服务器(45 GB左右,约2小时左右)``修改./docker/.env的45行,把HF_ENDPOINT 设成相应的镜像站点``HF_ENDPOINT=https://hf-mirror.com``$ cd ragflow/docker``$ chmod +x ./entrypoint.sh``$ docker compose -f docker-compose.yml up -d``   ``# 3 确认服务器状态``docker logs -f ragflow-server
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

5 在浏览器中输入服务器对应的IP地址并登录RAGFlow (可在终端中用 ipconfig 查看ip)

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

点击signup注册,填入电邮地址和密码后,返回登录页,用刚刚注册的电邮地址和密码登录。

docker相关命令

sudo docker images # 查看镜像``docker ps # 列出正在运行的容器``# 进入名为 ragflow-server 的容器``docker exec -it ragflow-server /bin/bash``cd /ragflow``ls``# 退出容器``exit

相关bug:
bug1:无法正常下载(If inside mainland China)
解决1:修改./docker/.env的45行,把HF_ENDPOINT 设成相应的镜像站点

bug2: dependency failed to start: container ragflow-mysql is unhealthy
解决2:docker compose down -v #移除所有本地数据
docker compose up -d

四 安装本地大模型LLM

安装ollama(一步步点就行)
地址:https://www.ollama.com/

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

下载qwen2:7b模型(4.4GB)阿里的千问大模型对中文很友好,所以选择它
说明,ollama中有许多开源模型,都可自行本地下载

ollama list #列出模型``ollama run qwen2:7b #下载运行模型``ollama rm          #删除模型``ollama show  #显示模型信息
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

下载Embedding模型
说明:一个免费的中文的向量化模型

ollama pull shaw/dmeta-embedding-zh``ollama list
www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

最后用浏览器打开 http://localhost:11434
可以看到页面中显示:Ollama is running

五 下载医疗数据集

地址:
huggingface.co/datasets/InfiniFlow/medical_QA

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)
medical_QA(医疗问诊助手数据集),它基于 PubMed 的数百万英文医疗论文,以及一些其他数据集,涵盖多个不同领域具有代表性的专业医疗数据,借助于 Agent 机制,提供中文问诊对话服务
ChatMed_Consult-v0.3.CSV 医疗咨询
Internal medicine_QA_all.csv 内科_QA_all.CSV
Medical Oncology_QA_all.csv 医学肿瘤学_QA_all.CSV
OB GYN_QA_all.csv 妇产科_QA_all.CSV
Pediatrics_QA_all.csv 儿科_QA_all.CSV
Andrology QA.CSV 男科QA.CSV S
urgical_QA_all.csv 外科_QA_all.CSV

公众号回复ragflowDir,免费领取相关数据集

六 RAGFlow 的使用

首先登录ragflow,进入后点击右上角图标

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

1 添加下载的本地千问模型和向量化模型

模型均在“第四步”做了安装
qwen2:7b:做问答chat的大模型
shaw/dmeta-embedding-zh:做embedding的,本地知识做向量化索引的

点击添加模型->按照如下添加向量化模型

因为ragflow使用的是docker,而ollama是在本地运行的,所以基础url为
base URL:http://host.docker.internal:11434

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

添加成功发后结果如下

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

2 创建知识库
2.1点击上方知识库–>创建知识库

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

2.2添加配置文件 语言选择中文,嵌入模型选择自己下载的,解析方法选择Q&A

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

2.3新增文件->上传第五步下载的医疗数据集QA

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

说明:如果不能一起上传,就单个上传

3 开始解析,等待成功 上传后点击右边放启动按钮,开始解析,等待解析成功,我这里文件80M左右,大约90分钟
原理:将每个QA对做成向量,用于提问后的匹配检索

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

4 检索测试 简单测试下知识库的相关搜索性

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

七 功能测试与使用

1 聊天(添加助理)

聊天–>添加助理–>配置相关参数(模型选择qwen2:7b) -->确定

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

模型选择qwen2:7b

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

测试聊天效果

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

2后端api服务
说明:通过部署的本地知识库大模型,不仅可以自己使用,还可以通过api给其他应用使用
右键打开聊天api

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

创建密钥

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

3 使用python程序调用

文档地址:https://ragflow.io/docs/dev/api

代码效果测试:

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

说明:测试代码太多了,就不贴了

最后

希望对大家有用,收集自己的行业数据集,快速在本地部署属于自己的专有大模型

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉👈

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

三、LLM大模型系列视频教程

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

目标:了解AI大模型的基本概念、发展历程和核心原理。

内容

  • L1.1 人工智能简述与大模型起源
  • L1.2 大模型与通用人工智能
  • L1.3 GPT模型的发展历程
  • L1.4 模型工程
  • L1.4.1 知识大模型
  • L1.4.2 生产大模型
  • L1.4.3 模型工程方法论
  • L1.4.4 模型工程实践
  • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

内容

  • L2.1 API接口
  • L2.1.1 OpenAI API接口
  • L2.1.2 Python接口接入
  • L2.1.3 BOT工具类框架
  • L2.1.4 代码示例
  • L2.2 Prompt框架
  • L2.3 流水线工程
  • L2.4 总结与展望

阶段3:AI大模型应用架构实践

目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

内容

  • L3.1 Agent模型框架
  • L3.2 MetaGPT
  • L3.3 ChatGLM
  • L3.4 LLAMA
  • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

内容

  • L4.1 模型私有化部署概述
  • L4.2 模型私有化部署的关键技术
  • L4.3 模型私有化部署的实施步骤
  • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉👈

www.zeeklog.com  - 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!(相关数据集和代码文末获取)

Read more

前端防范 XSS(跨站脚本攻击)

目录 一、防范措施 1.layui util  核心转义的特殊字符 示例 2.js-xss.js库 安装 1. Node.js 环境(npm/yarn) 2. 浏览器环境 核心 API 基础使用 1. 基础过滤(默认规则) 2. 自定义过滤规则 (1)允许特定标签 (2)允许特定属性 (3)自定义标签处理 (4)自定义属性处理 (5)转义特定字符 常见场景示例 1. 过滤用户输入的评论内容 2. 允许特定富文本标签(如富文本编辑器内容) 注意事项 更多配置 XSS(跨站脚本攻击)是一种常见的网络攻击手段,它允许攻击者将恶意脚本注入到其他用户的浏览器中。

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

目录 1. 打开浏览器开发者工具 2. 使用 Network 面板 3. 查看具体的API请求 a. Headers b. Payload c. Response d. Preview e. Timing 4. 实际操作步骤 5. 常见问题及解决方法 a. 无法看到API请求 b. 请求失败 c. 跨域问题(CORS) 作为一名后端工程师,理解前端如何调用接口、传递参数以及接收返回值是非常重要的。下面将详细介绍如何通过浏览器开发者工具(F12)查看和分析这些信息,并附带图片案例帮助你更好地理解。 1. 打开浏览器开发者工具 按下 F12 或右键点击页面选择“检查”可以打开浏览器的开发者工具。常用的浏览器如Chrome、Firefox等都内置了开发者工具。下面是我选择我的一篇文章,打开开发者工具进行演示。 2. 使用

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例)

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例) 前端开发中最令人头疼的莫过于那些难以定位的UI问题——元素错位、样式冲突、响应式失效...传统调试方式往往需要反复修改代码、刷新页面、检查元素。现在,通过Cursor编辑器集成的Codex功能,你可以直接用截图交互快速定位和修复这些问题。本文将带你从零开始,掌握这套革命性的调试工作流。 1. 环境准备与基础配置 在开始之前,确保你已经具备以下环境: * Cursor编辑器最新版(v2.5+) * Node.js 18.x及以上版本 * React 18项目(本文以Chakra UI 2.x为例) 首先在Cursor中安装Codex插件: 1. 点击左侧扩展图标 2. 搜索"Codex"并安装 3. 登录你的OpenAI账户(需要ChatGPT Plus订阅) 关键配置项: // 在项目根目录创建.