大模型 - 极客日志 (Page 28)

超越GPT-3.5!Llama3个人电脑本地部署教程

4月18日，Meta在官方博客官宣了Llama3，标志着人工智能领域迈向了一个重要的飞跃。经过笔者的个人体验，Llama3 8B效果已经超越GPT-3.5，最为重要的是，Llama3是开源的，我们可以自己部署！本文和大家分享一下如何在个人电脑上部署Llama3，拥有你自己的GPT-3.5+! 很多读者担心本地部署时个人电脑的硬件配置不够，实际上这种担心是多余的，笔者使用的是MacBook M2 Pro (2023款), 主要硬件配置如下： * • 10核CPU * • 16G内存部署步骤大致如下： * • 安装Ollama * • 下载Llama3 * • 安装Node.js * • 部署WebUI 安装Ollama Ollama可以简单理解为客户端，实现和大模型的交互，读者可以前往https://ollama.com/download，根据操作系统类型下载对应的客户端，比如笔者下载的是macOS的。下载之后打开，直接点击Next以及Install安装ollama到命令行。安装完成后界面上会提示ollama run l

4.8k star，开源免费，3分钟快速构建自己的知识库

最近各种AI工具，层出不穷，如果你想自己从0到1构建一套完全属于自己的知识库系统，那么这篇文章，你不可错过。这款开源工具和jumpserver、1panel是同一家公司开源的，今天简单部署尝试了一下，还是不错的。 MaxKB简介 maxkb是一款基于LLM的知识库系统，可以直接接入如liama3这种现有的开源模型，也可以接入如kimi、openai、通义千问等模型。考虑到网络问题，这篇文章记录的是采用kimi模型接入，也会介绍Liama3的接入方法，感兴趣的可以自行尝试。 MaxKB特点 * 开源、免费、操作方便 * 支持大部分已知大模型 * 配置完成后，可以直接嵌入已有的业务系统中 MaxKB快速部署这里直接采用docker-compose方式部署，如下为yaml文件： version: "3.8" services: maxkb: image: 1panel/maxkb restart: unless-stopped ports: - 9001:8080

本地运行Llama3极简傻瓜教程

meta 4.19号放出了最新的开源模型，啪啪啪打某度的脸，甚至有网友调侃：“水一百度会开，人一百度会死”(暗讽某莆田xx西事件)！废话不多说，开始我们的极简傻瓜教程。 Ollama 在本地简单的运行llama Ollama 是一个简化的工具，用于在本地运行开源 LLM，包括 Mistral 和 Llama 2。Ollama 将模型权重、配置和数据集捆绑到一个由 Modelfile 管理的统一包中。Ollama 支持各种 LLM，支持的模型如下： ModelParametersSizeLlama 38B4.7GBLlama 370B40GBMistral7B4.1GBDolphin Phi2.7B1.6GBPhi-22.7B1.7GBNeural Chat7B4.1GBStarling7B4.1GBCode Llama7B3.8GBLlama 2 Uncensored7B3.8GBLlama 2 13B13B7.

本地知识库搭建之路：从零到一

在信息爆炸的时代，如何高效地管理和利用知识，成为了一个重要课题。幸运的是，人工智能技术为我们提供了强大的工具，帮助我们搭建本地知识库，实现知识的高效管理和智能问答。今天，中羊将回顾我昨天的学习经历，带你一起仔细探索本地知识库的搭建之路。第一步：搭建本地 AI 环境 1.1 下载并安装 Llama3 Llama3 是 Meta 公司发布的开源大模型，拥有强大的推理和生成能力。我们可以通过以下步骤在本地部署 Llama3： 1. 下载 Ollama 软件：Ollama 是 Llama3 的客户端，用于与模型进行交互。您可以从公众号：郭震AI 获取 Ollama 软件下载流程，并按照指引进行安装。 1. 安装 Llama3 模型：在终端中输入 ollama run llama3 命令，

一文教会你在自己家电脑装上GPT大模型，没网也能用AI，GitHub 45.2K Star！【保姆级教程】

① 不用买特别的电脑，家里的旧电脑跑起来也行。 ② 安装超简单，跟点点鼠标似的，支持各种操作系统。 ③ 不光是Llama 2和Gemma，还有一堆其他的AI模型可以用。 ④ 围绕这个项目，已经有了一大堆的周边工具，比如网页界面、桌面应用、开发工具包什么的。接下来，咱们来看看怎么一步步把这个项目跑起来。一、下载大模型首先前往 https://github.com/ollama/ollama下载符合自己电脑的安装包，像小航用的是Mac电脑，就下的Mac版的安装包，如果你是Windows系统就下载Windows的安装包就行，大同小异。 2.安装大模型下载完了之后，双击安装，根据提示一步步操作，最终打开命令行或终端窗口，敲入下面的命令，一键启动Llama2模型（小航的8GB内存也能成功装上）。 ollama run llama2 3、运行大模型等它跑起来，看到界面上出现提示信息，说明大脑模型已经准备好了。我们来随便问个问题试试看吧。 4、装个类GPT页面但这样使用，实在是太丑了，小航忍不了了。

大模型

微调大型语言模型：根据您的需求定制Llama 3 8B

自2022年11月发布以来，ChatGPT引发了关于大型语言模型（LLMs）和一般人工智能能力的广泛讨论。现在很少有人没听说过ChatGPT或尝试过它。尽管像GPT、Gemini或Claude这样的工具非常强大，拥有数百（甚至数千）亿的参数，并在大量文本语料库上进行预训练，但它们并非万能。有些特定任务这些模型无法胜任。然而，我们并非没有解决这些任务的办法。我们可以利用小型开源模型的力量，将它们适应到我们的特定问题上。本博客旨在简要概述一些较小的开源LLMs，并解释两个关键的LLM微调概念：量化和LoRA。此外，我们将介绍一些最受欢迎的微调库以及代码示例，以便您能快速将这些概念应用到您的用例中。让我们深入了解微调。目录 1、“小”型大型语言模型 2、量化 3、低秩适应（LoRA） 4、Unsloth 5、监督微调训练器（SFT） 6、优势比偏好优化（ORPO） 7、结论 8、参考文献 “小”型大型语言模型微调LLMs可能代价昂贵，尤其是对于参数数量庞大的模型。根据经验法则，

HuggingFace + Ollama + Llama 3.1：轻松搞定Llama 3.1中文微调版本安装

Meta公司最近发布了Llama 3.1，但在中文处理方面表现平平[1]。幸运的是，现在在Hugging Face上已经可以找到经过微调、支持中文的Llama 3.1版本。这篇文章将手把手教你如何在自己的个人电脑上安装这个强大的模型，并进行详细测试，让你轻松享受流畅的中文AI体验。准备好了吗？让我们一起开始吧！安装Ollama Ollama是一个强大的机器学习模型管理工具，能够帮助我们快速安装和管理各种大语言模型。以下是安装 Ollama的步骤： macOS MacOS 下载 Ollama 链接 - https://ollama.com/download/Ollama-darwin.zip Windows Windows 下载 Ollama 链接 - https://ollama.com/download/OllamaSetup.exe Linux Linux 下载并安装 Ollama curl

用Llama3零成本构建私有AI知识库

今天的分享是关于如何零成本搭建一个私有的AI知识库，这个方案特别适用于那些面临大量产品知识需要记忆的销售人员。我的一个朋友，一位中年转行到医疗器械公司的销售员，最近就和我聊到了这样的问题：产品种类繁多，技术参数复杂，要为客户推荐合适的产品，就需要有深厚的产品知识储备。这对于他来说是个挑战，因为除了要学习产品知识，还要面对领导的压力和业绩的挑战，这使得他的工作倍感压力。于是我给他提出了一个建议：将产品说明和技术资料提供给AI，让AI来学习。这样，销售人员在推广产品时遇到问题，可以直接向AI咨询，或者让客户自己向AI提问，以了解他们适合哪种产品。这样的智能客服问答系统可以大大减轻基层销售人员的工作负担。如果你也有类似的需求，那么接下来的方案可能会对你有所帮助。这个方案完全利用本地资源，不需要任何费用，并且可以轻松地嵌入到第三方平台，比如你自己公司的网站、微信小程序等等。让我们先来看看这个知识库的效果。这里展示的是知识库中的一个产品说明截图为例，它包含了产品适用的病症的患病人群发病率数据。现在，我将向AI提出一个问题，看看它如何回答。看到了吗？AI不仅给出了答案，并指

AnythingLLM：零成本的私人ChatGPT，支持几乎所有主流大模型

大家好，我是猫头虎 😸！今天给大家带来一个非常有用的工具——AnythingLLM，它是一款全栈应用程序，能够让你零成本地搭建自己的私人ChatGPT，支持几乎所有主流的大模型。无论你是AI技术大牛还是初学者，都可以通过它轻松创建高效的AI聊天机器人！🌟 🚀 AnythingLLM：打破限制，轻松构建私人ChatGPT 🚀 什么是AnythingLLM？ AnythingLLM是由Mintplex Labs Inc.开发的一款开源工具，专为构建私人化的ChatGPT而设计。你可以利用现有的商业化大型语言模型（LLM）或者流行的开源LLM来创建一个功能强大的私人聊天机器人。更棒的是，它支持本地运行，也可以远程托管，灵活适应你的各种需求。主要功能与优势 1. 支持多种大模型：AnythingLLM兼容GPT-4、Llama 3、Gemma、Kimi等几十种大模型，你可以根据需要选择合适的模型来实现最佳效果。 1. 简单的部署和配置：通过简单的命令即可在本地或Docker容器中运行大模型，快速搭建属于自己的知识库系统。内置的向量数据库LanceDB支持向量

AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama一键部署

一.引言身处2024年，大模型技术从底层模型到都卷的要命，我们可以说是幸运的，也可以是幸福的，当然，学习的路上，不停的追赶，必定是疲惫的。分享一些丝滑的大模型技术栈内的项目，让大家疲惫并快乐着。今天要讲的是一个大模型推理服务框架-Ollama，对比的还有Xinference、OpenLLM、LocalAI，从丝滑角度而言（这里特别强调一下，我所讲的丝滑，指的是众所周知的网络环境下，学习、部署、应用等环节，坑最少，最易上手），Ollama>=Xinference>LocalAI>OpenLLM。今天重点将Ollama，其他框架另起篇幅。二.一行代码完成Ollama本地部署这里由衷推荐docker部署，一行代码搞定 docker run -d --gpus=all -v /yourworkspaces/Ollama:/root/.ollama -p 11434:

AI智能体研发之路-工程篇（四）：大模型推理服务框架Xinference一键部署

一.引言大语言模型推理服务框架—Ollama介绍了Ollama，Ollama以出色的设计一行命令完成推理框架部署，一行命令完成大模型部署，模型的下载不依赖梯子，速度非常快，大幅提升模型部署效率，同时，当有多卡GPU时，Ollama可以自动将模型分片到各个GPU上，博主使用V100显卡（单卡32G显存）部署llama3 70B（预计需要40G显存），自动完成了显存分配。今天来介绍一下Xinference，与Ollama比较，Xinference自带Webui与用户交互更加友好，只需点一下所需要的模型，自动完成部署，同时，Xinference在启动时可以指定Modelscope社区下载模型，对于无法登陆的伙伴，可以大幅提升模型下载效率。这里还是想说两句，大模型领域，美帝目前确实是领先的，我们能做的只能是努力追赶，但在追赶的过程中发现，好多优秀的大模型领域开源项目，都是默认配置hugging face的，一方面是下载模型时间甚至超过了熟悉项目本身，另一方面是压根连不上导致项目跑不起来，导致在这片土地上水土不服。当然对在这片热土上生存的企业及工程师，可能学习门槛的提升，也是一件好事

大模型

本地快速安装运行史上最强开源LLaMa3大模型

史上最强开源AI大模型——Meta的LLaMa3一经发布，各项指标全面逼近GPT-4。它提供了8B和70B两个版本，8B版本最低仅需4G显存即可运行，可以说是迄今为止能在本地运行的最强LLM。虽然LLaMa3对中文支持不算好，但HuggingFace上很快出现了各种针对中文的微调模型，本文将从零开始介绍如何在本地运行发布在HuggingFace上的各种LLaMa3大模型。准备环境本文的演示环境是Mac M1 16G内存，自备工具，使用开源Ollama运行大模型，使用Open WebUI作为前端访问界面，通过浏览器访问，体验十分接近GPT：安装软件首先安装Ollama，它可以让我们非常方便地运行各种LLM。从下载，运行，点击安装Ollama命令行，然后在命令行测试Ollama是否已正常运行： $ ollama -v ollama version is 0.1.32 下载模型 Ollama可以直接下载内置的几种模型，但选择有限。我们更希望从下载以便方便地评估各种模型，所以，这里我们并不从Ollama直接下载，而是从HuggingFace下载。在Hugging