大模型 - 极客日志 (Page 18)

AI大模型本地离线部署全攻略：三种方案及安装教程详解

1.为什么要本地离线部署Ai大模型？离线部署AI大模型有多个重要原因，涵盖了安全性、隐私、成本、控制性和可靠性等方面。以下是一些主要的原因和详细解释： 1.1. 数据隐私和安全 * 敏感数据保护：某些应用需要处理高度敏感的个人或商业数据，如医疗记录、金融信息或知识产权数据。离线部署可以确保这些数据不离开本地环境，减少泄露的风险。 * 合规性：一些行业和地区对数据保护有严格的法规和要求（如GDPR），要求数据必须在本地存储和处理。 1.2. 成本控制 * 长期成本降低：虽然初期的硬件投资较高，但长期使用本地部署可能比持续支付云服务的使用费用更为经济，特别是在处理大量数据或频繁使用时。 * 避免云计算费用波动：使用云服务时，费用可能会因使用量波动而不可预测。离线部署能够提供更稳定的成本控制。 1.3. 性能和延迟 * 低延迟：本地部署可以提供更低的延迟，特别适合需要实时响应的应用，如自动驾驶、工业控制和实时通信。 * 高性能：在本地部署中，硬件资源专用于特定任务，可以进行更好的性能优化。 1.4. 控制和定制化 * 完全控制：本地部署允许你对硬件和软件环境

llama3+web_ui+open_interpreter搭建教程

硬件要求：内存：8G以上（最好16G或者32G）硬盘：5G以上的空间一、llama3:8b 安装教学 1.介绍 llama3:8b是一个基于大语言模型（LLaMA）架构的模型，它是由 Meta Research 在 2022 年提出的一种预训练语言模型。 llama3:8b 模型具有以下特点： 1.架构：它使用 LLaMA 架构，这是一个基于 transformer 的架构，旨在处理长文本和多任务学习。 2.参数数量：模型拥有 8.3 亿个参数，是一个非常大的模型。 3.预训练：模型经过了大规模的预训练数据集的训练，包括 Common Crawl、Wikipedia 和 BookCorpus

Ollama：本地部署大型语言模型的全面指南

Ollama 简介 Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架。官网： GitHub 地址： Ollama 安装下载安装 Ollama 在 Ollama 官网根据操作系统类型选择对应的安装包，这里选择 macOS 下载安装。安装完在终端输入 ollama，可以看到 ollama 支持的命令。 Usage: ollama [flags] ollama [command] Available Commands: serve Start ollama create Create a model from a Modelfile show Show information for a model run Run a

Ollama 如何排除故障

Ollama 日志 Mac 有时，Ollama 可能无法如你所愿运行。解决问题的一个好方法是查看日志。在 Mac 上，你可以通过运行以下命令来查看日志： cat ~/.ollama/logs/server.log Linux 在使用 systemd 的 Linux 系统上，可以用这个命令查看日志： journalctl -u ollama Docker 在容器中运行 Ollama 时，日志会直接输出到容器的标准输出和标准错误输出中： docker logs <container-name> （使用 docker ps 可以找到容器的名字）如果你是在终端里手动运行 ollama serve，那么日志会显示在该终端上。 Windows 在 Windows 上运行 Ollama 时，

使用Ollama提供的Llama3 8B搭建自己的斯坦福多智能体AI小镇

自从斯坦福发布了Generative Agents: Interactive Simulacra of Human Behavior论文后，迅速燃起了人们对多智能体的兴趣。许多著名的机构也都投入到相关的研究之中，其中a16z开源的AI小镇相比斯坦福原始的AI小镇，在保留原始AI小镇功能的基础上，更易上手，因此本文将使用a16z开源的AI小镇项目，带大家一起部署一个属于自己的AI小镇，使用本地部署的Ollama即可运行，全程免费。本篇将带大家部署项目原始英文版，下一篇将提供一个我自己翻译之后的版本，并带大家一起部署。项目地址: https://github.com/a16z-infra/ai-town 项目支持Linux系统和macOS系统，Windows系统的朋友可以使用WLS进行部署。 1 环境信息本文内容，所使用系统为macOS，以下是所使用到的相关代码、库的信息： * ai-town版本：所使用的原始项目commit id=8449a052d9d107691f42bf8b3233ef0481c8e3e6 * npm版本：8.19.2 *

大模型

借助ollama实现AI绘画提示词自由，操作简单只需一个节点！

只需要将ollama部署到本地，借助comfyui ollama节点即可给你的Ai绘画提示词插上想象的翅膀。具体看详细步骤！第一步打开ollama官网：https://ollama.com/，并选择models显存太小选择的是llama3\8b参数的instruct-q6_k的这个模型。运行方式也很简单，只要你网络没问题，直接在终端里，运行ollama run llama3:8b-instruct-q6_K这个命令，这样你可以在终端里llama3交流了！当然咱们说的是在comfyui里运用llama3模型实现提示词自由的，所以我们需要安装comfy ollama节点，如图所示直接install即可然后开始搭建ollama提示词节点，节点的提示词部分包含三个部分第一部分汉译英过程：命令提示词为：Translate the following into English, do not add any text other than the prompt: 其中节点：cr text concatenate是帮助字符串链接的一个节点！其中上面的是指令规则，下面的是要执

惧怕人工智能不如拥抱人工智能，聊聊如何使用Spring AI框架快速开发大模型项目

自ChatGPT出现以来，技术圈子里人人自危，导致大家心态越来越浮躁，生怕努力学习来的技术最后被人工智能轻易替代变得一文不值。其实换个角度来说大家也不用过于担心，社会的向前发展，生产力工具的优化更迭导致效率的提升是不变的主题，既然发展大势不可逆，何不端正心态，拥抱变化，让更先进的工具助力我们更好的工作生活。 Spring AI是什么？ Spring AI是一个由Spring官方社区推出的项目，旨在简化Java AI应用程序的开发。以下是对Spring AI的详细介绍： * 定位与目标：Spring AI是AI工程师的一个应用框架，它的目标是将Spring生态系统的设计原则（如可移植性和模块化设计）应用于AI领域，并推广使用POJO（Plain Old Java Object，即简单的Java对象）作为AI领域应用程序的构建块。 * 技术特点：基于Spring框架：Spring AI基于Spring框架，允许开发者轻松将其集成到现有的Spring项目中。 * 语义分析和自然语言处理：Spring AI结合了先进的语义分析和自然语言处理技术，能够理解和处理用户

LLM意图识别器实践

利用 Ollama 和 LangChain 强化条件判断语句的智能提示分类 ❝ 本文译自Supercharging If-Statements With Prompt Classification Using Ollama and LangChain一文，以Lumos工具为例，讲解了博主在工程实践中，如何基于LangChain框架和本地LLM优雅实现了通用的意图识别工具。简短回顾 Lumos! 🪄 我以前写过不少关于 Lumos 的内容，所以这次我就简短介绍一下。Lumos 是一个基于本地大型语言模型（LLM）开发的网页浏览辅助工具，呈现为 Chrome 浏览器插件形式。它可以抓取当前页面的内容，并把抓取的数据在一个在线内存 RAG 工作流中处理，一切都在一个请求上下文内完成。Lumos 建立在 LangChain 基础上，并由 Ollama 本地LLM驱动，开源且免费。 Lumos 擅长于大型语言模型（LLM）所擅长的任务，比如： * 摘要新闻文章、论坛帖子与聊天历史

5分钟手把手系列(三)：本地编写一个AI Agent（Langchain + Ollama）

背景随着AI技术的不断升级，AI智能体的应用场景也非常多应用场景下不断普及与落地，很多线上零代码编排平台也如雨后春笋一般的普及开来，那作为天生爱专研的阿里人，肯定不满足于各种封装好的平台工具使用，也是希望能通过代码层面一探究竟，看看大家耳熟能详的AI智能体是怎么现实的。本文就是基于此目的，通过简单的教程，帮助大家实现AI Agent层面的第一个”“hello world”程序demo。在实现demo之前，首先还是给不熟悉AI Agent的同学介绍一下相关的概念，以及AI Agent相对于普通模型的优势。 AI Agent 首先要理解一个背景，普通预训练好的模型，在回答用户问题时，只能使用他预训练时的知识信息，但这些训练数据往往不是最新的，大部分可能停留在2022~2023年左右，而定期去使用最新数据全量训练各个模型的做法是各个公司无法接受的，所以就衍生出一个必现的问题，用户对AI模型提出的问题，如果涉及到一些未在训练数据中的私密内容、或者最新内容，AI是无法回答的。至于通过微调、提示词优化等手段去优化训练模型，也仅仅是使得模型对于某类场景更好用而已，无法解决AI知识库

从零开始：在Linux上部署本地AI大模型并与本地知识库对接的全程记录

使用到的工具 * docker * oneapi + fastgpt * ollama 安装docker 已安装有docker的话跳过这一步执行命令安装docker（一行一行执行） curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun systemctl enable --now docker 执行命令安装docker-compose（速度会比较慢） curl -L https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose chmod

RAG 实践指南：使用Ollama与RagFlow构建本地知识库

前言上一篇文章我们介绍了如何利用 Ollama+AnythingLLM 来实践 RAG ，在本地部署一个知识库。借助大模型和 RAG 技术让我可以与本地私有的知识库文件实现自然语言的交互。本文我们介绍另一种实现方式：利用 Ollama+RagFlow 来实现，其中 Ollama 中使用的模型仍然是Qwen2 我们再来回顾一下 RAG 常见的应用架构 RagFlow的安装和部署前置条件 * CPU >= 4 核 * RAM >= 16 GB * Disk >= 50 GB * Docker >= 24.0.0 & Docker Compose >= v2.26.1 安装克隆仓库 $ git

大模型

简单三步，在家轻松创建个人AI知识库，非常详细收藏我这一篇就够了

一、引言本文会手把手教你如何部署本地大模型以及搭建个人知识库，使用到的工具和软件有 * Ollama * Open WebUI * Docker * AnythingLLM 本文主要分享三点 * 如何用Ollama在本地运行大模型 * 使用现代Web UI和本地大模型"聊天" * 如何打造完全本地化的知识库：Local RAG 读完本文，你会学习到 * 如何使用最好用的软件Ollama部署本地大模型 * 通过搭建本地的聊天软件，了解ChatGPT的信息是如何流转的 * RAG的概念以及所用到的一些核心技术 * 如何通过AnythingLLM这款软件搭建完全本地化的数据库二、ollama的安装以及大模型下载 2.1 安装ollama 官方下载地址：当安ollama之后，我们可以通过访问如下链接来判断ollama是否安装成功 http://127.0.0.1:11434/ 2.2 使用ollama运行本地大模型当安装完成ollama之后，我们就可以在命令行中运行如下命令既可以 ollama run [model name]