大模型 - 极客日志 (Page 29)

GraphRAG的用户界面&本地版的GraphRAG实现：GraphRAG-UI

GraphRAG的用户界面&本地版的GraphRAG实现：GraphRAG-UI，支持最新版graphrag-0.3.3。可为GraphRAG提供方便的管理和交互方式，支持配置 ollama等本地模型。特点： * Web 界面: 提供了 Web 界面，可以通过界面配置和使用 GraphRAG * 索引管理: 快速创建、更新和管理文本数据索引 * 查询执行: 提交自然语言查询，并从索引数据中获取相关内容,之后从大模型获取相应结果 * 配置选项: 支持自定义各种设置和参数 * 日志和监控: 通过日志和状态更新,监控索引和查询任务进度参考文献： [1] github：https://github.com/wade1010/graphrag-ui 如何系统的去学习大模型LLM ？大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。事实上，抢你饭碗的不是AI，而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后，

Dify 与 FastGPT 流程编排能力对比分析

一、引言在人工智能快速发展的今天，大语言模型（LLM）应用平台正在重塑各行各业的工作流程。其中，Dify 和 FastGPT 作为两款具有重要影响力的工具，凭借各自独特的流程编排能力，为开发者和使用者提供了强大的支持。流程编排的优劣直接影响着应用的效率、灵活性和可扩展性，因此深入理解这两个平台的特点对于选择合适的工具至关重要。 Dify，作为一款开源的大语言模型应用开发平台，为开发者提供了丰富的功能和灵活的操作方式。其流程编排注重全面性和综合性，旨在满足多样化的应用开发需求。 FastGPT，作为一个基于大语言模型的知识库问答系统，在流程编排方面更侧重于精准和高效的问答处理，为特定场景提供了专业的解决方案。本文将通过详细对比 Dify 和 FastGPT 的流程编排能力，深入分析它们各自的特点和优势，为开发者和企业用户在选择适合的工具时提供有力的参考。二、Dify 与 FastGPT 概述（一）Dify 简介 Dify 是一款融合了后端即服务（Backend as Service）和 LLMOps 理念的开源大语言模型应用开发平台。其主要特点和优势包括： 1.

【AI大模型】llama.cpp模型量化（本地） + ollama部署（docker）（超详细实况二）

前言上一篇我们完成了模型的微调和导出，但是模型文件我们是不好直接使用了，为了在本地也能随时使用，因此我们还需要对微调后的模型文件做一些操作 1.llama.cpp 1.1 c++编译工具准备为此我们需要借助llama.cpp对模型文件进行量化，经由llama.cpp量化后的模型（以llama3.1-8b指令微调版为例）即使是在个人消费级显卡也能顺利运行 llama.cpp是由C++编写的，因此为了在本地使用，首先我们需要下载VisualStudio，地址下载这个安装器后双击打开，选择这个C++ 桌面开发工具确认安装即可，安装后需要重启电脑在命令行输入cmake检验 1.2 本地编译llama.cpp 建议单独建立文件夹存放llama.cpp git clone https://github.com/ggerganov/llama.cpp.git -编译- cd llama.cpp mkdir

【大模型部署】速通llm模型微调和部署anythingllm（超详细实况三）

前言大家好，上一篇我们已经完成了部署，但是ollama的命令行页面调用对我们来说必然是不方便也不美观的，因此在学习过程中偶然遇见了anythingllm这个框架，以下是使用实况的记录拉取anythingllm 本地和docker都有用过，但最后还是选择docker管理（docker使用多了之后真会会上瘾的,不知道各位是否也是一样的） anythingllm官网 anythingllm桌面端下载地址首先我们打开cmd 拉取镜像 docker pull mintplexlabs/anythingllm 运行ollama docker镜像因为我是使用的windows11，所以打开shell $env:STORAGE_LOCATION="你的anythingllm数据存放地址"; ` If(!(Test-Path $env:STORAGE_LOCATION)) {New-Item $env:STORAGE_LOCATION -ItemType Directory}; ` If(!(Test-Path "$env:STORAGE_LOCATION\.env"))

Open-webUI 这个71.9K 的代码库真的有点东西，让人人都可拥有一款免费私人助手

大模型可以说是近期最热的话题之一，不管是国外的ChatGPT、llama3等，还是国内的文心一言、通义千问等，都可以说是热的发红、红的发紫，秉承着了解的态度，我在github上发现了跟大模型相关的项目，其star高达71.9k，其就是ollama（），ollama是什么呢？——一个支持在本地运行大语言模型的工具，兼容 Windows、Linux 和 MacOS 操作系统。使用 Ollama，您仅需一行命令即可启动模型，下面让我们一起来看看这个项目。安装其支持Windows、Linux、MaxOS操作系统，怎么下载呢？最简单的办法就是进入官网：模型下载因为其是一个工具，所以安装后是没有对应的模型的，为了调用模型则需要下载对应的模型，其支持很多款本地大语言模型，完整版可以访问其，下面列举出来几个常用的： ModelParametersSizeDownloadLlama 38B4.7GBollama run llama3Llama 370B40GBollama run llama3:70bPhi 3 Mini3.8B2.3GBollama

大模型

【大模型部署】本地部署Llama3教程，断网也能用啦！

Meta在官方博客官宣了Llama3，标志着人工智能领域迈向了一个重要的飞跃。经过笔者的个人体验，Llama3 8B效果已经超越GPT-3.5，最为重要的是，Llama3是开源的，我们可以自己部署！本文和大家分享一下如何在个人电脑上部署Llama3，拥有你自己的GPT-3.5+! 很多读者担心本地部署时个人电脑的硬件配置不够，实际上这种担心是多余的，笔者使用的是MacBook M2 Pro (2023款), 主要硬件配置如下： * 10核CPU * 16G内存部署步骤大致如下： * 安装Ollama * 下载Llama3 * 安装Node.js * 部署WebUI 安装Ollama Ollama可以简单理解为客户端，实现和大模型的交互，读者可以前往下载之后打开，直接点击Next以及Install安装ollama到命令行。安装完成后界面上会提示ollama run llama2，不需要执行这条命令，因为我们要安装llama3。下载Llama3 打开新的终端/命令行窗口，执行以下命令： ollama run llama3 程序会自动下载L

【大语言模型】在Windows平台使用本地部署大模型构建本地知识库

大模型迅猛发展的今天，知识的更新日新月异。如果你苦于知识文本繁杂，使用查询的时候又无从下手，你可以考虑使用大模型技术来帮助你检索查询所需的知识点。对有文件内容安全性考虑的用户，可以部署本地化的大模型已解决当前需求。现阶段有多种构建方式 1.Ollama+AnythingLLM ：这种方式部署简单，可以迅速上手，但是AnythingLLM使用默认的向量模型性能一般，所以在使用知识库查询时，经常容易出现无法查询到相关信息的情况。 2.Ollama+FastGpt：这种方式是本教程教学的构建方式，是现阶段搭建本地知识库最好的选择。因为可以自定义向量模型等各类所需要的模型，查询结果质量较好，但是缺点就是搭建过程繁琐。 👉👈 使用Ollama+FastGpt构建本地知识库环境配置 Python依赖环境在这之前需要先安装python，由于大部分大模型基于Python语言开发，所以对于 Python 应用程序所需的软件和工具的集合，也就是依赖环境，应当尽量保持在最新版本。注意点 1.Python安装时，记得勾选pip（Python 中的标准库管理器），这是用于更

使用你笔记本CPU来搭建本地大模型知识库

搭建本地大模型知识库随着各自开源模型的发展，让入门变得非常简单，现在需要修改任何代码，直接就可以在本地运行一个自己的私人助手。搭建中最大的难点就是你需要解决科学上网问题本地快速运行 ollama # 下载并运行llama3 $ ollama run llama3 >>> /? Available Commands: /set Set session variables /show Show model information /load <model> Load a session or model /save <model> Save your current session /clear Clear session context /bye Exit /?, /help Help

本地电脑用Ollama部署大模型并安装Chatbox

某些场景下可能希望构建一个完全本地离线可用的大模型，方法很多，模型也很多，比如 qwen、qwen2、llama3等，最简单快捷的首推使用 ollama 部署，模型选用 qwen 或 qwen2，针对中文任务效果更好。首先下载 ollama 双击安装(277MB) ollama下载地址：下载后双击安装安装完毕后打开命令行黑窗口开始菜单中找到命令提示符，点击打开或者随便打开任意一个文件夹，然后在文件夹地址栏中输入 cmd 按回车。都能打开一个黑窗口找到想要使用的模型，推荐 qwen系列打开这个网址可以选择要使用的模型比如使用 qwen，点击进入后，会看到如下点击下拉框，可选择模型版本列表，4b 代表该模型有40亿参数，当然参数越大效果越好，但同样也要求你的电脑配置越高，不够高的话不仅运行慢，还可能卡死机。如果你有英伟达显卡，并且独立显存不低于12G，可以选择 14b

Ollama+FastGPT，一键搭建部署本地私有大模型！

搭建本地私有AI大模型智能体工作流涉及使用Ollama和FastGPT这两个工具。这里简要介绍它们的基本概念和如何结合起来建立工作流： Ollama Ollama是一个开源的AI模型部署工具，可以帮助用户在本地环境或云端部署和管理大型语言模型。它的主要功能包括模型加载、推理服务和与用户接口的集成。使用Ollama的步骤： 1. 模型选择与配置： * 选择适合你需求的语言模型，例如GPT模型。下载模型权重和配置文件。 1. 模型加载与部署： * 使用Ollama提供的命令行工具或API，加载模型并在本地或云端启动推理服务。 1. 接口定义与集成： * 定义和配置模型的输入输出接口，以便与其他应用程序或服务进行集成。 1. 性能优化与监控： * 对部署的模型进行性能优化和监控，确保在不同负载下的稳定性和效率。 FastGPT FastGPT是一个优化了推理速度的GPT模型实现，专注于提高处理速度和资源利用率。它通常基于加速计算库（如CUDA或TensorRT）和模型剪枝等技术来实现高效的推理。使用FastGPT的步骤： 1. 模型选择与准

RAG 实践-Ollama+AnythingLLM ，零基础也能轻松搭建本地知识库

什么是 RAG RAG，即检索增强生成（Retrieval-Augmented Generation），是一种先进的自然语言处理技术架构，它旨在克服传统大型语言模型（LLMs）在处理开放域问题时的信息容量限制和时效性不足。RAG的核心机制融合了信息检索系统的精确性和语言模型的强大生成能力，为基于自然语言的任务提供了更为灵活和精准的解决方案。 RAG与LLM的关系 RAG不是对LLM的替代，而是对其能力的扩展与升级。传统LLM受限于训练数据的边界，对于未见信息或快速变化的知识难以有效处理。RAG通过动态接入外部资源，使LLM得以即时访问和利用广泛且不断更新的知识库，进而提升模型在问答、对话、文本生成等任务中的表现。此外，RAG框架强调了模型的灵活性和适应性，允许开发者针对不同应用场景定制知识库，从而满足特定领域的需求。下图是 RAG 的一个大致流程： RAG就像是为大型语言模型（LLM）配备了一个即时查询的“超级知识库”。这个“外挂”不仅扩大了模型的知识覆盖范围，还提高了其回答特定领域问题的准确性和时效性。想象一下，传统的LLM像是一个博学多才但记忆力有限的学者，它依赖于

大模型

大模型部署：Ollama运行HuggingFace下载的模型

本地运行模型我之前都直接使用LM-studio，好用、无脑。本地用足够了。但是放在服务器上才是正道，本地运行无法长时间开启保持运行，而且Ollama推出了并行GPU计算之后可用性大幅提升，可用性很高。今天研究下如何用Ollama如何在本地来使用这些HF的开源模型，后面把它搬到服务器上。设置设置很简单，先在电脑上创建一个文件夹，比如我会把我的模型放到一个雷电3外接的nvme硬盘上，路径是/Volumes/RD/Modules。然后在这里直接创建，格式可以参考Ollama的文档。 bash 代码解读 touch lmstudio-ai/Meta-Llama-3-8B-Instruct-GGUF/Modelfile 从HuggingFace下载模型 1. 使用HuggingFace 从HugginFace下载模型需要挑选下。这里我先以Meta-Llama-3-8B-Instruct为例子，我之前下载了lmstudio-ai/Meta-Llama-3-8B-Instruct-GGUF。如果网络存在问题可以选择国内镜像站，给大家推荐一个镜像站，当然也可以去国内的下